档案

Archive for the ‘坑’ Category

Watson和SIRI

2011/11/27 1条评论

看到2011-11-16一篇文章《Misconceptions in AI: Or why Watson can’t talk to Siri》, by Stacey Higginbotham

部分赞同,部分反对(很明显,作者不懂背后的技术)

这里占个位,有空来写写我对Watson和SIRI比较的看法

2011-12-19 补充Siri的负面体验两则


分类:语义网,

资源:DL-Learner

2011/05/21 1条评论

一些关于从ABox学习TBox的资源。

目的:语义压缩。所有的Machine Learning,在本质上都是压缩算法。

DL-Learner: http://dl-learner.org/Projects/DLLearner/OnePageIntroduction

Jens Lehmann:http://jens-lehmann.org [publications]

略读了一下,感觉不是很有说服力(convincing)。对所谓Re nement Operator,觉得没有什么特别的。由于这本质是一个搜索问题,文中却没有什么讨论搜索策略。没有和统计方法和信息论结合,我觉得是很大的弱点。

分类:资料,

2004年Ames骚乱(1)

2011/05/09 1条评论

2004年4月18日,我还在Iowa State University读书。小城是Ames。ISU每年4月举行一次校庆活动,称为Veishea,各系各团队和全城各色人等都会来参与游行,然后就是各种名目的party。2万多年轻人狂欢,什么事不会出?七八年前出了人命,从此规定,这天晚上的party,不准饮酒。

这天凌晨,我突然想到有一本书没有还,已经到期了,就开车去图书馆。路过“市中心”(几条街喽),看到灯火通明,路边站着全是学生,觉得略微有些奇怪。忽然有一个东西闪着火花从我车前飞过,我以为是烟花。等我开过这群人,突然听到后面的骚动声,回去看,见有白烟,人都在跑。出事了,我那唯恐天下不乱的神经兴奋起来,赶快停了车回去看。还没走几步,只闻到刺鼻的瓦斯味,眼泪刷得就要出来——原来刚才闪着火花的,不是烟花,是催泪瓦斯弹。

七八年再来一次,应验了!这次是为什么呢?

【待续】

分类:回忆,

笔记:LP几种常见语义的小结

2011/04/29 留下评论

Perfect Model Semantics 完美模型语义

Teodor C. Przymusinski: On the Declarative and Procedural Semantics of Logic Programs. J. Autom. Reasoning 5(2): 167-205 (1989)

对谓词(命题)指定优先级。令M和N是两个Herbrand model。 N<=M(N is preferable),如果对N-M中的每个元素,M-N中都有一个比它大。M是完美的(perfect)如果没有其他模型比它更preferable(<=)

Stable Model Semantics 稳定模型语义

Michael Gelfond, Vladimir Lifschitz: The Stable Model Semantics for Logic Programming. ICLP/SLP 1988: 1070-1080

令M是一个模型(一组atom的集合),P是一个program。PM是一个新的program

  • 如果B在M中,那所有含有¬B在if部分的规则都删掉(不成立的)
  • 在剩下的规则中,把所有的negative literals都删掉(不再必要了)

这个称为G-L变换。如果M是PM的一个least Herband model(注意,PM里现在不含¬),那M是P的一个稳定模型语义。

这是一个陈述性的语义(declarative semantics)

Well-Founded Semantics 良基语义

Allen Van Gelder, Kenneth A. RossJohn S. Schlipf: Unfounded Sets and Well-Founded Semantics for General Logic Programs. PODS 1988: 221-230

WFS是构造性的(constructive),它的定义就一步步给出了良基的构造方法。

【待看到更多资料后更新】

分类:笔记, 逻辑,

为国际会议建元数据(4)

2011/04/12 1条评论

(4) 数据的范围和来源

详细的,哪些数据要包括进来,从哪里来,写起来太枯燥,故放到一个Slides里,下面做一些解释

(做这个事,主要是RuleML2011的metadata chairs需要)

【回家吃饭,待续】

分类:语义网,

安徽省省会考

2011/04/10 留下评论

【我是蚌埠人。蚌埠曾多次做安徽省省会,但此事很少人知道。特做一些考证,列在维基百科安徽省条下(2011-02-10)。附在这里,疏漏错误难免,有待修正。蚌埠做安徽省会,也有许多逸事,比如倪督坠马小南山,鬼子花差华昌街,待得闲填坑。】

  • 1667-1760 江宁(清安徽布政使司驻地),安庆(清安徽巡抚衙门,按察使司,都指挥使司驻地)[3]
  • 1760-1853 安庆(清安徽布政使司驻地)
  • 1853-1861 安庆(太平天国安徽省驻地)
  • 1853-1862 庐州(合肥)(清安徽布政使司驻地)
  • 1862-1911 安庆(清安徽布政使司驻地)
  • 1911-1914 安庆(中华民国安徽省军政府/政府驻地)[4]
  • 1914-1920 蚌埠(中华民国安徽省政府驻地,倪嗣冲时期)
  • 1920-1925 安庆(中华民国北洋政府安徽省政府驻地,张文生马联甲吕调元姜登选时期)
  • 1925-1927 蚌埠(中华民国北洋政府安徽省政府驻地,陈调元时期)
  • 1927-1927 芜湖(中华民国国民政府安徽省政府驻地)
  • 1927-1929 安庆(中华民国国民政府安徽省政府驻地)
  • 1929-1929 蚌埠(中华民国国民政府安徽省政府驻地,方振武石友三时期)
  • 1929-1938 安庆(中华民国国民政府安徽省政府驻地)
  • 1938-1938 六安(中华民国国民政府安徽省政府驻地)
  • 1938-1945 蚌埠(伪中华民国安徽省维新政府/国民政府驻地)
  • 1938-1945 立煌(金寨)(中华民国国民政府安徽省政府驻地)
  • 1945-1948 合肥(中华民国国民政府安徽省政府驻地)
  • 1948-1949 安庆(中华民国国民政府安徽省政府驻地)
  • 1949-1949 芜湖,屯溪(中华民国国民政府安徽省政府驻地)
  • 1949-1952 合肥(中华人民共和国皖北行政公署驻地)
  • 1949-1949 屯溪(中华人民共和国皖南行政公署驻地)
  • 1949-1951 芜湖(中华人民共和国皖南行政公署驻地)
  • 1951-1952 合肥(中华人民共和国皖南行政公署驻地)
  • 1952年至今 合肥(中华人民共和国安徽省政府驻地)
分类:历史, , 旧文

美国国家科学基金的评审(3)

2011/03/31 留下评论

[填坑,填完睡觉]

什么样的报告会最可能被据掉?一般来说,NSF的专家小组(Panel)还是比较公允的,虽然偶尔也会有比较狗血的结论。比如有一次,几个牛人中的战斗机一起攒了一个申请,结果最后被据掉了,原因?“你们这么多牛人在一起,怎么内部摆平啊?”牛也有牛的烦恼啊。

假如各位有幸没有这种烦恼,那首先注意下列各点

  • 错别字,错别字,错别字。
  • 糟糕的参考文献。引用太多网页,有权威出处而不引,遗漏主要相关工作,引用格式不规范,等等。
  • 几乎没有既有工作。
  • 和既有工作重叠太多。
  • 没有合理的实验和验证方案。
  • 没有和教育结合的计划。比如研究生培养,博士后培训,高中生科普,等等毁人的方案。
  • 太多的工作或太少的工作

总的来说,评价要素分两大块

  1. Intellectual Merits(技术创新性):工作的重要性,方案的合理性,计划的可行性,组织的严密性等
  2. Broader Impacts(潜在影响):对社会和经济的潜在影响,合理的技术转移方式(比如开源,文章),学研结合,促进公平(affirmative action的意思)。【这一块其实比较软,但是如果专家组找不到好的理由来据,有很大的空间在这里鸡蛋里挑骨头,所以一样要慎之又慎】

这么说太抽象,举几个典型的panel summary(专家组评审意见摘要)的例子:

  • 该申请书提出了XYZ的技术路线。PI在这个问题上表现出深刻的见解,研究计划甚为合理。【恭喜!<10%的申请书可以得到此类的评价】
  • PI对XYZ领域提出了新颖且合理的方法。PI充分论证了解决此类问题的重要性及现有方法的局限性。研究方案的假设合理,评估方案清晰。该研究计划成功的机会很高。【该有的都有了】

下面一些就是相对灰色的评价了

  • 该申请书涉及了一个重要的领域,PI是一个非常合格的学者。但申请书没有充分地说明该课题的研究方式。【也即,具体的研究方案不够细致,或者要技术思路说的太笼统】
  • 该PI选择了一个重要的领域,该领域有很大的创新空间。但是专家组认为选定的技术方案是一个非常简单的低风险的方法,而且其中关键假设XYZ缺少评估方案。【太简单了不行,缺少评估方案往往被秒杀】

最糟糕的莫过下面的评价了

  • 该申请书没有提供任何技术细节,也没有证据表明该方案可以推进这个领域的研究前沿,或者优于现有方法。【这个申请纯粹是来打酱油的】
  • 该申请涉及一个重要领域。不过,计划本身缺少足够的技术细节,专家组无法鉴定该方案的创新之处。参考文献不全,某些论述有明显的技术错误。无整合相关技术的方案,无评估方案。【基本上能犯的硬伤全占了】

总结

  • 规则1:NSF永远正确【所说的申请书评估准则,字字是金,千万要对号入座。网上有很多NSF的directors的slides和学校的申请帮助说明,一定要多看】
  • 规则2:如果NSF不对,请参见第一条。

【待续】

分类:, 捣浆糊

《The Information》读后感(1)

2011/03/24 3 条评论

The Information: A History, a Theory, a Flood》已经到了,从昨天晚上开始看。Amazon上只要$16,还有语音书版本。

看了两章,还是很有趣的。比如里面说非洲土著有一种鼓语,和莫里斯电码差不多,用高低两种音调模拟单词(这些语言里还没有字母),利用大约8倍的语义冗余,可以向几公里外传递信息。

我用Twitter写了一些很短的读后感,集中在这里,没什么次序。

In fact, semantic msg predated symbolic ones: paleolithic paints of horses expressed models of horses, rather than the word “horse”

Some people worried about the use of calculator. They are not alone, Plato worried that writing will make ppl not practicing their memory

I conjecture entropy of Chinese names is >> English ones, not symbolically but in semantics, often with profound meaning tied to history etc

Transformative inventions have something in common: they lead to things unplanned. We still use wheels in ways unimaginable 10k yrs ago.

Persistence of writing allows so many unplanned possibilities (you name it). Persistence of LIFE (as web allows) isn’t less revolutionary

Writing first, then logics invented. Same here: structured web first (RDF? maybe, or not), then semantics. Warning: logics is never popular

Literacy allows one to describe notions without references to their models (instance) – this is a great semantic compression

Can there be math beyond simple counting without writing? Now Web is the extended brain, what new devices of thinking will be invented?

懒得翻译成中文了。先挖个坑,以后也许填,也许不填。

西瓜大丸子汤,2011-03-24

分类:笔记, , 信息论