2009年12月21日 星期一

DWN Construction

+lookup current lexical database
+ask KYOTO Chinese Processing
+extract pattern from treebank
+query domain knowledge acquire
+LOD, dbPedia

新聞的意義

當新聞是可預測的
我們還需要看新聞嗎

2009年12月14日 星期一

Automatic Constructing Domain Ontology

Load 2516 Chinese GEMET terms with R.
Check them in my ONE domain text.
Observe their semantic relation.

Chech them in cna_cmn_env

Try idf

2009年12月9日 星期三

語言(義)學可從理性推裡出發

人生出來就有推理能力,沒有語言能力
藉由推理能力去學語言

不要太鑽研linguistic form or function
只要找出基本的function
其他藉由推裡可得

basic form only
then free composition/assemble meaning

2009年12月7日 星期一

WordNet Knowledge CA

中文WordNet裡面龍有好幾個意思,
一個是東方龍,代表吉祥
一個是西方龍,代表邪惡
這種文化差異也被包含在WordNet裡面
所以文化知識是無法在Word Knowledge以及World Knowledge裡被分開的

2009年12月5日 星期六

DWN建法

结合Lexical Pattern与现有词典找出Domain Term Knowledge

2009年12月1日 星期二

神□百草经?

你猜空格處是什麼字?

那「神农百草经」呢?
是「醫」還是「農」?

也許大部分的人都會猜是「神農百草經」
而非「神醫百草經」
那為什麼會這麼猜呢

當我們只需四個字的上下文就能一致、正確地猜出中間少的是什麼字
是不是表示我們其實具備某種詞彙知識能幫助我們進行判斷
那這個知識是什麼呢?

Word and Context

Miller & Charles (1991):
Speakers' knowledge of words must consist not only of the meaning of the words but also of the contexts in which they can occur.