Lowan is a project for the Lojban artificial language.
If you can read chinese , you may read the following slide to understand why the project started.
We target to build a set of tools for Lojban multilingual applications , include kowledge base in JSON format (KB), multilingual machine translation (MT) , information retrieval (IR), multilingual wiki system (include editor) for lojban (WS), and the other tools and application that may be useful for Lojban users.
我們企圖建立一組專為邏輯語設計的工具與應用,包含知識庫(KB)、多語言機器翻譯(MT)、資訊檢索(IR)、維基系統 (WS) 以及其他對邏輯語使用者有幫助的工具與應用。
We hope the project may help the widespreading of Lojban, and let more people know, learn, speak and write in Lojban.
在邏輯語官方網站中有 各國語言對邏輯語的翻譯字典檔 。
我們運用程式 /kb/buildKB.js 將這些字典轉換成 JSON 格式,像是 l2e.json (邏翻英), l2c.json (邏翻中), e2l.json (英翻邏) 等字典,以便讓後續的程式可以方便的處理。 (注意 e2c.json 並非 lojban 官網的字典,而是我們用維基百科某詞頻表加上 google 翻譯所做出來的)。
您可以用下列指令建構這些 JSON 字典。
cd kb
node buildKB.js
"a":"sumti or",
"a'au":"attitudal: moved",
在 /mt/ 資料夾中存放有邏輯語的翻譯系統,目前已經建構好(邏翻英) 的部分,等到成熟一點再開始考慮 (邏翻中) 的部分。
在 /parser/ 資料夾中有 parser.js ,是我們將 lojban 官網中推薦的 camxes.js 程式轉成 node.js 模組後,用來進行剖析 (parsing) 的程式。
parser.js 的用法如下:
$ node parser "mi klama vi vu" ==> 印出完整語法樹
$ node parser "mi klama vi vu" -s ==> 印出簡化語法樹```
$ node parser "mi klama vi vu" -s -pretty ==> 印出有縮排的簡化語法樹
$ node parser "mi klama klama vi vu le" ==> 傳回錯誤
$ node parser lojban1.txt -f -s ==> 讀檔後印出簡化語法樹
D:\Dropbox\cccwd\web\lowan\parser>node parser "mi klama klama mi vu le"
ltext=mi klama klama mi vu le
error={"name":"SyntaxError","expected":[],"found":"l","message":"Expected end of
input but \"l\" found.","offset":21,"line":1,"column":22}
D:\Dropbox\cccwd\web\lowan\parser>node parser "mi klama mi vu" -s -pretty
ltext=mi klama mi vu
很可惜的是,camxes.js 非常慢,用來 parse 的速度超慢,光是一個北風與太陽的 200 字小故事,竟然要花五秒鐘。
我們應該會將 camxes.js.peg 改寫為 BNF,然後用 jison 來產生新的 parser。
這裡居然有邏輯語的 yacc 語法,這樣就可以很容易的餵給 jison 產生 parser 了。
目前其他部分尚未完成,專案還在進行當中 ....