二子從周 作品

第七百四十一章 生僻字的重要性

“是嗎?”周至說道:“那為何我研究過一些關於文字系統的論述,結果發現一般中文應用系統,也需要一萬三千個左右的漢字;而大型的中文應用系統,則需要兩萬三千個左右的漢字;政府機關的專用中文應用系統,則需要四萬八千個左右的漢字;而大型圖書館用的中文應用系統,需要的漢字可能超過十萬呢?”

“哪裡這麼誇張?”李紅江是計算機信息技術的大拿,然而對漢字編碼也是半路出家,對於編碼算法,字庫編程,函數耦合等技術性的東西有豐富的經驗,然而大型圖書館需要超過十萬的漢字這種概念,也徹底顛覆了他的認知。

“的確有這麼誇張。”辜老說話了:“光康熙字典,就有四萬七千零三十五個漢字,也就是說,如果我們圖書館要對康熙字典進行數字化採集,你們這個還沒有投入的gB13000,將有一半的漢字,在系統當中顯示不出來。”

辜振鐸也開口了:“我主持編纂的《漢語大字典》,收入的單字也有五萬六千個,如果用gB2312標準,只夠一個零頭,如果用gB13000,也只夠一小半。”

旦增大師作為歷史系的重要人物,今天也參與了這個會議,這時候也說道:“大家不要忘了,我們祖國是一個多民族的國家,除了漢語以外,還有藏文,蒙文,壯文,維吾爾文等十多種文字,這些少數民族文字的信息化編碼工作,也是應該要納入考慮的。”

辜振鐸聽著都覺得有些過分,這最大最主要的語種都還沒有搞定呢,哪裡顧得到其他,於是說道:“這個要求也實在太苛刻了,得讓搞信息技術的同志們一步步來嘛……”

“還不止這些啊!”旦增不退反進:“除了少數民族文字,還有古代文字呢,比如甲骨文,啊甲骨文不算,可以算作一種字體,但是突厥文,回鶻文、于闐文、西夏文,這些不能不算吧?”

“旦增主任,我們先解決主要矛盾,主要矛盾。”麥主任聽得頭都大了:“次要矛盾先放一放……”

“不用放,無解。”李紅江將手一攤:“碼位就好像放字的盒子,碼位就那麼多,因此能放的字也就那麼多,gB13000標準兩萬一千零三個漢字,是我們經過辛苦的研究才搞出來的。”