冷僻字打不出來 細(xì)數(shù)“E時代”漢字“缺字”尷尬
在計算機(jī)越來越普及的今天,漢字在生活中的使用悄然進(jìn)入了“E時代”——人們在更多地閱讀電子文件,,書寫漢字的習(xí)慣也逐漸從筆尖轉(zhuǎn)到了指尖,。然而受字庫、編碼等原因的限制,,目前現(xiàn)有輸入法存在很多無法輸入的“缺字”,,給不少人造成了困擾。諸如“電腦打不出生僻字,,村民無奈改姓”的報道不時見諸報端,。
字庫缺字問題影響中文輸入
中國歷史源遠(yuǎn)流長,先賢造字,,蘊(yùn)含著豐富的文化信息,。據(jù)相關(guān)統(tǒng)計數(shù)據(jù)顯示,流傳至今的漢字大約有9萬個左右(最新《中華字?!肥兆?5568個),,其中常用的約有7000字(2013年頒布的《通用漢字規(guī)范表》是8105個)。值得注意的是,,許多打不出來的字就在這7000多字之中,,只不過稍微生僻了些便“人識而機(jī)不識”。中文輸入法急需“補(bǔ)倉”,,進(jìn)一步提高“識字”能力,。今年6月,搜狗輸入法通過“一字千金”活動向網(wǎng)友廣泛搜集現(xiàn)下中文輸入法的缺字,。日前,,搜狗發(fā)布《中文輸入缺字報告》,宣布已尋回漢字4萬多個,。
從漢字輸入法的發(fā)展歷程來看,,是向著更加簡單易學(xué)且便捷高效的方向轉(zhuǎn)變的。從1981年國家標(biāo)準(zhǔn)局發(fā)布《信息交換用漢字編碼字符集基本集》GB2312-80以來,,30多年間,,漢字輸入法經(jīng)歷了從無到有,,從難到易,從簡單到智能的演變過程,。第一階段,,以五筆輸入法為代表,需要記背特定的字根符號和拆字規(guī)則,,在熟悉掌握之前需要經(jīng)過很長的一段時間練習(xí),;第二階段,以智能ABC為代表,,只要掌握漢語拼音就能完成漢字輸入,,大大降低了中文輸入的使用門檻;第三階段,,以搜狗輸入法為代表,,可以聯(lián)想式輸入字詞句,各種智能設(shè)置和搜索引擎技術(shù)的加入,, 讓漢字輸入變得快捷又高效,。可以說,,中文輸入法的演變始終圍繞實用性和普及性進(jìn)行,,因此許多生僻字的缺失并不是輸入法改進(jìn)的關(guān)注重點。
漢字輸入法中存在的缺字問題著實給很多人造成了困擾,。長期使用五筆輸入法的黃先生說,,自己遇到過的印象最深刻的缺字是“镕”字,因為前國家總理朱镕基先生的名字中就有這個字,,以前在使用五筆輸入法的時候總是沒法打出這個字,,這讓他每次遇到要寫朱總理名字的時候都犯難。北京語言大學(xué)的郭之恩老師回憶說,,自己的一位高中同學(xué)因為名字中的“祎”字沒法在電腦中打出來,,高考的時候只能用“□”代替其名字的信息。俗話說“行不更名,,坐不改姓”,,可是很多人卻因為電腦打不出自己的姓氏而被迫改姓。山東省菏澤市高莊村的兩百多名“公式(shǎn)”姓村民便因為曾經(jīng)的姓氏在電腦上打不出來,,導(dǎo)致買火車票,、辦銀行卡等諸多生活中的事情都辦不了而只好改姓為“冼”(xiǎn)。
輸入法缺字的現(xiàn)象可說是中文獨(dú)有,,拼音文字因為字母有限,,不論拼法如何改變,最終總能將字母組合起來成為所需單詞,而漢字的結(jié)構(gòu)組成千變?nèi)f化,,要在現(xiàn)有鍵盤的基礎(chǔ)上,,發(fā)明一種能輸入所有漢字的輸入法實屬不易。早在活字印刷時期漢字就遇到過類似的窘境,。如今,,隨著各類中文輸入法基本定型,人們使用輸入法的習(xí)慣也漸漸固定,。如何解決漢字輸入時的缺字問題便成了目前各種中文輸入法面臨的問題,。同時,隨著電腦進(jìn)入人們生活的深度和廣度的擴(kuò)大,,解決輸入法中的缺字問題刻不容緩。
補(bǔ)全字庫之外還有改進(jìn)余地
北京語言大學(xué)信息科學(xué)院教師于東長期研究漢字編碼領(lǐng)域問題,,他介紹說,,目前缺字輸入的編碼技術(shù)問題已經(jīng)基本得到解決,這也就意味著以前許多因編碼技術(shù)問題而缺失的字將逐步得以補(bǔ)全,。那么,,隨著缺字的補(bǔ)全,漢字輸入是否還有其他可以改進(jìn)的地方,?中國人民大學(xué)文學(xué)院教師熊燕建議,,輸入法可以提供不同級別的用戶字庫,如:普通用戶/古籍用戶/方言用戶,,或者:萬字用戶/全能用戶等,。這樣做既可以滿足大多數(shù)人使用輸入法時的快捷需求,又能滿足特殊人群的用字需求,。
以鍵代筆,,終至“提筆忘字”,已成了互聯(lián)網(wǎng)時代漢字文化退化的一個縮影,?!耙粜畏蛛x”的特點,使得包括漢字等文字在技術(shù)和通信高度發(fā)達(dá)的今天,,面臨著與基于字母的文字更為嚴(yán)峻的挑戰(zhàn):日常書寫與計算機(jī)輸入形式上的差別,,令非常用字詞的存續(xù)越發(fā)困難。南開大學(xué)孔祥卿教授認(rèn)為,,要緩解這種狀況,,可以讓更多的漢字通過筆畫輸入、部件輸入和筆畫部件混合輸入的方法,,甚至可以讓輸入法成為學(xué)習(xí)新字的方法,,這樣解決了計算機(jī)時代手寫與鍵盤的矛盾,也能在一定程度上避免因長期使用電腦而提筆忘字。
隨著輸入法的便捷和快速的特點越來越鮮明,,越來越多的人在輸入漢字時不注意字詞的選擇,,各種別字層出不窮。北京語言大學(xué)的郭之恩老師認(rèn)為,,計算機(jī)漢字輸入大大消滅了錯字,,卻使別字大行其道。作為生活中的一小部分,,“火星文”可以博我們一笑,,讓限于定勢的思維得到放松,但是于漢字本身,,輸入法在這方面應(yīng)該更加注意改進(jìn),。另外,中國大陸使用的是簡體輸入法,,但是港澳臺地區(qū)包括部分海外華人所使用的卻是繁體字,,中文輸入的繁簡之間既存在著技術(shù)性的問題,也存在著一個文化對接的問題,。
借助《中文輸入缺字報告》以及后續(xù)可能跟進(jìn)的改進(jìn),,搜狗輸入法的努力使我們意識到,更多的漢字應(yīng)該在互聯(lián)網(wǎng)中“復(fù)活”過來,。網(wǎng)絡(luò)時代,,“即使生命已經(jīng)逝去,過去的痕跡和記憶仍然將在數(shù)據(jù)中永遠(yuǎn)存活下去”,。從這個意義上講,,漢字輸入法正在創(chuàng)造漢字文明“E時代”的新傳承。(黃章悅 田 靜)