这里有关于语义网的噪声、看法、吐槽,和其他随便什么东西

学习的陷阱

2012/02/29 发表评论

最近两个月主要的工作就是学习,学习到脑子要爆炸的程度。

到了企业工作以后,工作的重心发生了改变。从做最前沿的探索,到怎么搭系统解决问题,我需要了解很多以前不熟悉的领域

  • 自然语言理解
  • 用户界面和用户体验
  • 新型数据管理的方法,如文档数据库(document database)和三元组数据库(triple store)
  • 多种数据通信与交换协议
  • 新的编程语言和工具,如Python
  • 非技术的,方法论问题,企业文化问题,产业环境和市场动态问题

上述问题的解决都似乎是建立一个可用的产品必要的前提条件。

在杀死一棵树后,看着堆积如山的一堆打印文稿,我突然感到一种危险:我又要进入学习的陷阱了。(为什么要说“又”?)

我可以一直学习下去,学上一整年,还是不能做出一个有用的系统。

停止学习,开始做,在做中学习。似乎是一个好想法。——但是这个想法一样是危险的。其实,连这个系统是否有人会用,我都不知道。做一个没人用的东西有什么意义?

我决定停止学习一段时间,想清楚这个几个问题

  • 我需要什么样的团队?通过什么样的途径能够找到第一流的人才在这个团队里?制约因素是什么?我自己不可能学会建一个可用的系统的所有知识,也不要知道。
  • 我的假设是什么?怎么验证这些假设?(Lean Startup原则)
  • 我的利益相关方是谁?谁可能提供我需要的资源?
  • 怎么才能和用户走得近一些,再近一些?

P.S. 回去又看了一遍任正非的《一江春水向东流》。感觉又深了一层。这里面有些东西,大概是大多数美国人(包括硅谷的这些企业家和管理专家)无法理解的。

 

 

分类: 工程创业

思想大爆炸之精益创业(Lean Startup)

2012/02/27 2 条评论

注:最近博客写得少,其实都是转回新浪微博@西瓜大丸子汤了。微博阵地有自己的游戏规则,用好了,还是蛮有用的。

最近两个月一直在读书,从Weaving the Web开始,到Facebook Effect, Steve Jobs, In the Plex。这个周末读了两本(怎么做到这么快?Audible.com帮了大忙): Lean StartupPretotype It。这一系列书读下来,对我的洗脑非常有效,经历了又一次思想大爆炸。

注:前几次思想大爆炸发生在1996年(关于复杂系统),2000年(关于科研的方法论和“体制问题”),2009年(关于财务)。什么叫爆炸?就是一种很亢奋的积极的不停产生新想法的状态,并且想:我为什么没有早一点知道这样的世界观和方法论?

很多感想都写在微博上了。我懒得整理。就总结一句话吧:

不管是创业、科研、生活,还是随便什么,快速原型、假设检验最重要,以减少时间的浪费。

到底这么说是什么意思,根据lean startup原则,我也就不解释了(否则要花我几个小时)。上面这句话就是我的MVP (minimal viable product)。

回顾自己的半生,太多时间浪费在无意义的事上。人生不可能预见所有的事,Steve Jobs也说,你只能做过之后才能connecting the dots(串起自己的轨迹)。不过,的的确确有多事情,本来稍加快速原型、假设检验,就可以避免花几个月、甚至几年的时间才知道不值得去做。

人的一生,自己就是自己的一个产品(还有其他产品了)。怎么最快最好地发展这个产品,需要方法论。可惜很多人(包括我自己),很多时候,限在局部最小里,不知道怎么快速地和这个时代一同进步。好在现在改改,可能还不算太晚。

分类: 方法论

妞两岁了

2012/02/17 发表评论

有一阵子没写妞了。妞爸妞妈都太忙。妞进步的速度已经超过了我们记忆的能力,只能挂一漏万地提几句。

妞妞换了一个新daycare一段时间了。上学第一天没有哭,更奇妙的是,爸爸妈妈接她的时候,她竟然无动于衷,直接忽略爸爸妈妈的存在,仍低头玩自己的,不愿意走。老师说她在班上最小,确特爱指挥人。比如,到外面玩的时候,她抢着给小朋友换鞋,吃完饭,她主动把小凳子推到桌子下面。

告状。比如要玩什么东西爸爸不给她玩,就哭着(没眼泪啦)找妈妈:“爸爸搞的”。要是妈妈不给妞吃冰淇淋,就哭着找爸爸:“妈妈搞的”。

搞清楚颜色了。比如盖被被,会要求说:“白色的(被被)”。

表演。会一边跳舞,一边说:“是这样(跳)的,是这样的”。最拿手的是“世上只有妈妈好”。唱第一段的时候脸上做幸福状,唱第二段的时候做哭状。

数数。每天下楼梯爸爸会数:“1,2,3,…17”。结果妞就学会数10以后的数了。在诱导下,还会数20以后的数。所以现在爸爸要去干什么事,妞妞象小尾巴一样缠着爸爸,爸爸就会说:“妞妞藏,数到60,爸爸找”。妞就会乐不及地去找个角落开始数数。

听故事能跟上情节了。最爱听《丑小鸭》,听到鸭妈妈不喜欢小天鹅,妞会说:“小天鹅哭了”,做哭状(拳头在眼睛外侧转转)。到听到小天鹅找到妈妈了,妞会说:“妈妈好”,把手放在脸边做幸福状。

玩Youtube玩得纯熟。能自己在Pad上打开Youtube图标,点历史视频,然后根据相关视频找自己想看的。上下屏翻,停止,重放,全会——没人教。

配合刷牙。以前给她刷牙,实在是体力、脑力和忍耐力的多重考验。现在告诉妞妞,牙齿有“黑虫”,如果不捉黑虫,会把牙齿吃掉。有时候,在她吃完饭后,还真揪出个肉末啊、菜叶啊,给她看,“黑虫”。所以现在给她刷牙,只要说一句“黑虫”,小人就乖乖地把嘴巴张得大大的,让你刷牙。

怕“舅舅”。自从上次舅舅来了,吼过妞妞几句(“好好睡觉!”),“舅舅”就变成了妞妞不好好睡觉时候妈妈的专用术语(“再不睡觉舅舅来了”)。结果“舅舅”慢慢就变成各种可怕事物的关联。比如去医院打疫苗,裤子还没脱,妞就开始大哭(以前打过,知道疼),大喊:“舅舅,舅舅”。

先说这么多——其实每天都不知道有多少好玩的事,根本记不过来。每天把这个小肉团抱一抱,别的什么狗屁事情都是浮云了。

P.S. 妞妈补充如下

罚站:爸爸妈妈偶尔让做错事的妞妞time out,结果妞妞也把这一招用到爸爸妈妈身上了。有一次爸爸不知道怎么得罪妞妞了(细节不记得,总之是把妞妞气哭了),爸爸说了“sorry”,妞妞还不依不饶,大叫“爸爸站!”爸爸不得不跑到罚站的垫子上表示一下。

撒娇:妞妞经常有些纯撒娇的无理取闹,大多数时候爸爸妈妈都当没看见,不理她。但,某些撒娇还挺管用。比如,妞妞小床边放了一张大床,是爸爸妈妈哄妞妞睡觉时候用的。爸爸每次陪妞妞睡觉到要离开的时候说“妞妞,爸爸走了,妞妞晚安”。妞妞就一下子冲过来,抱紧爸爸的脖子,爸爸就给征服了,软绵绵地躺回去。妞妞发现这个屡试不爽。

故意搞怪。有一次妈妈陪妞妞头靠头一起在旁边的大床上睡觉,妞妞一不小心,后脑勺撞了妈妈的眼睛鼻子,撞的生疼,妈妈大叫。妞妞很深情的说了“sorry”,还用小手摸了摸妈妈的眼睛。妈妈还在眼冒金星的状态没反应过来的时候,没想到,妞妞又躺成原来的姿势,又以同样的力度和角度把妈妈给撞了一下。“乖乖,妈妈今天倒什么霉呀。”妈妈很纳闷,也有点无奈,“这家伙怎么这么不小心”。就在妞妞重复了“sorry”和抚摸动作之后,妞妞立即躺倒,以同样的姿势又撞过来了。这次妈妈看到了,这家伙第一次是无意撞了妈妈,后来都是是有意撞的!妈妈侧着的脸稍微偏了一下方向,妞妞心里大概是纳闷“咦,这次怎么没撞上?”只见她,回过头来,瞄准了几秒钟,重新撞了过来。妈妈气不打一处来,自然又time out 她了。

分类: 妞妞

语义网是什么?有什么好处?

2012/02/16 发表评论

我对知乎上一个问题的回答:http://www.zhihu.com/question/19550885

说来话长。不同的学派在这个问题上差距太大了。如果我们过滤掉各种学术理想的“噪声”,看现实工业应用有的语义技术,可能可以总结出如下特点——当然,哲学的讨论永远看不到结束的迹象。

  • 语义网有所谓的W3C模式(就是RDF,OWL, SPARQL等)。这个模式发展很慢,很多人质疑。越来越多的人在探索其他模式。
  • 很多所谓做语义网技术的公司核心技术都是别的,比如NLP,比如检索,比如数据库。语义网是他们数据的一层皮。看宣传一定要小心。
  • 目前全世界做语义网技术提供方案的公司,排得上号的大概有150家左右。

那 语义网到底有什么用。用非常不精确的语言讲:

  • 动态的数据建模,不需要什么schema或者shema可以快速演进(这是和数据库和XML比的好处)
  • 让数据流动起来,而不是封固在一个个的网站或者应用里。
  • 支持更多的任务自动化。(怎么做到?一些数据可机器处理,一些推理,一些查询)

语义网界研究早期有很多现在已经被纠正的概念(比如语义网的目的就是让机器读网页)——早期,大多数人都低估了它的困难程度。按Nova Spivack的说法,传统意义上的语义网(ca 2000定义)大概要到2030年才能实现。到2020年左右,如果运气好的话可能能实现Data Web,也就是让Web的上数据能自由流动起来。推理啊,机器理解啊,不是这个阶段的核心任务。

============

2012-04-30 Part 2: 对另一个问题的回答 http://www.zhihu.com/question/20203785

第一点,解放思想,实事求是。语义网是一个被外界误解极深,内部分歧极大的领域。工业界的实践,和标准化组织、学术界的主流(也就是大家日常看到的各种入门教材),差距很大。最近两年,工业界的新实践(吸取了传统方法的种种血的教训后),大多都没有还没有来得及反应到教材里。很多早期的教材,读了反而有害。

做语义网的研究,最好是从问题出发。哪些问题是需要知识的?什么情况下结构化数据是可能获得的?可以廉价地获得的?有什么用处?带着问题去找方法,不管是不是RDF/OWL,只要能解决这类问题,就是语义网的方法。

大多数情况下,很少有一个单独的方法能解决整个问题;语义网的研究,只着眼于结构化数据/知识本身是不够的,相关学科,如自然语言理解、机器学习、非关系数据库、人机交互,都很重要。最有学术价值或者商业价值的研究,往往在这些领域的综合和交叉里

 

分类: 语义网

语义网的公司 True Knowledge

2012/02/06 1 comment

认字记

2012/01/24 1 comment

妞妞今天实现伟大的战略突破:认字。

每天从幼儿园回来,妞妞都会带当天的“作业”回来——贴纸啊,涂颜色啊。每张纸上都会写上“妞妞”的名字。老师是中国人,所以就直接写汉字了。

今天妞妞在玩的时候突然指着自己的“作业”说:“妞妞”。我发现她的小指头指着自己名字,就问:“什么是妞妞啊?”妞就指着那两个字又说了一遍“妞妞”。

我在纸上写了一个“好”字,一个“妞”字,问:“哪个是妞啊?”妞正确地指出来了!

增大难度,写了三个字:爸、妈、妞。妞妞又指出哪个是“妞”了。

—————–

另外一个突破,也是今天的:妞现在会数1到10了(这不是新闻)。但是今天她在玩数字积木的时候,找到了三个“6”,然后大喊“三个六!”这说明,她不但在语法形式上知道了数字,还在语义形式上知道了什么是“三”。

妞也开始会写数字,至少有两个:“2”和“3”,虽然走样走得充满想象力,毕竟在拓扑上还是同构的。

语言上还有一些突破

  • “世上只有妈妈好”整个句子会说了。
  • 叫妞妞去洗脸,妞妞说“洗过了”。状语和时态的概念也有了!

马上就要24个月(2岁)了!

分类: 妞妞

哄觉记

2012/01/21 发表评论

(作者:妞妈)

2012-01-17:昨晚睡觉的时候,妞妞嚷嚷身上痒。妈妈给她挠了前胸后背,还痒,妈妈纳闷不是才洗澡么?后来妈妈抓遍了她身上每个可以触摸到的角落,包括鼻子,耳后跟,脚丫。最后妈妈说“好了,所有的地方都挠了,都不痒了,赶快睡觉吧”没想到,她小手一指,小嘴一噘,让妈妈挠她嘴唇。妈妈就顺便亲了一下“好了,该睡了”。接着她边翻白眼(想问题呢)边呲牙咧齿,把牙齿送过来…再后来,把小嘴做出N种形状送过来,还包括吐舌头。有人听说过舌头痒的吗?

2012-01-18:昨晚妈妈躺在妞妞边上哄妞妞睡觉,妞妞不免在妈妈身上翻来翻去。兴致高的时候,唱起“Head, shoulders, knees and toes, Knees and toes. And eyes, and ears, and mouth, And nose”。边唱边指点江山。小手指一下戳到妈妈眼睛,妈妈尖叫一声,捂起眼睛。妞妞发现问题了,怯生生地说了声“sorry”然后大声喊客厅的爸爸。妈妈奇怪,“妞妞为什么喊爸爸?”妞妞接着喊“爸爸,爸爸,站(这个“站”字是后来妈妈才反应过来的)”。等爸爸惊恐赶到,妞妞说“垫,站。垫,站 。”(参《罚站记》)原来妞妞知道做错事了,自动请罚。

外两则:

  • 妞妞有时候唱歌的时候,爸爸妈妈跟着一起唱。她有时候就不高兴,小手食指放在嘴边“嘘”一下。言外之意,“你们别唱了”。
  • 妞从1数到10已经很流利了。
分类: 妞妞