国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区

掃一掃
關注微信公眾號

構筑穩健的中文Linux(上)
2008-09-18   ChinaITLab 

Linux是操作系統中的一朵奇葩,是中國軟件發展的機遇。要使這朵奇葩在中國的大地上生根、發芽、開花,要想抓住Linux機遇,首先必須解決中文本地化的問題。
1999年政府公開支持在中國發展Linux,國內出現了好幾家制作中文Linux發布版本的公司,推動了Linux在中國的發展和普及,但在初期中文Linux都是采用中文平臺的方式。
一、“中文平臺”
“中文平臺”是為了讓計算機能處理中文信息,在操作系統上建立必要的中文處理手段,即在ASCII碼的操作系統上架構一個中文處理環境,用來提供中文的輸入、顯示、打印和中文文件的存儲、處理、傳輸,并為應用軟件開發和運行提供支持,俗稱“中文平臺”。
中文平臺的主要技術特點是在ASCII碼的操作系統上架構一個中文處理環境。該中文處理環境為了簡化字符處理而使用的處理碼可能是把漢字作為一個寬字符來處理,但進出核心的代碼流都采用文件碼,即多字節字符,所以中文平臺本質上仍是按字節處理中文。
從顯示方式來講,可分為字符界面和圖形界面兩種“中文化”方式。字符界面的“中文化”又可分為內核漢化和外掛式兩種。內核漢化是直接修改Linux內核的源程序,使之能處理中文信息。外掛式是不修改Linux內核的源程序,在原有應用程序接口(API)之外增加一層中文信息處理的支撐平臺。
圖形界面的“中文化”本質上都屬外掛式,但實現的方式有:
修改XFree 86、即修改X Server;
修改XWindow的庫函數Lib X11.so;
利用LD-PRELOAD載入動態庫。
中文平臺具體實現的技術特點各不相同,充分展現了中國人的聰明才智,但也帶來一些問題。
1. 沒有相應的標準,使中文應用軟件在多版本之間的可移植性造成困難。有可能出現在某一版本中文平臺上運行的中文應用軟件在另一個版本的中文平臺就不能運行或不能很好運行的情況。中文應用軟件開發商可能要為每一個版本的中文平臺開發一個產品。這對中文應用程序的發展很不利,而應用又是Linux能否發展的一個極重要的問題。
2.中文平臺實際上仍是字節處理,而不是以字符為單位來處理,可能與ASCII碼造成沖突,不能徹底解決漢字與ASCII碼的沖突。而且不能徹底解決漢字的輸入、輸出問題,比如半個漢字的問題(顯示、刪除半個漢字,光標半個漢字移動)。
3.中國是由56個民族組成的大家庭。中國使用漢字的人占絕大多數,中文主要是漢語,但也包括其他少數民族的語言文字。海內外華人使用的漢字有簡體與繁體,日本語、朝鮮語中也有漢字。“中文平臺”和“中文化”是個很不確切的說法。而且中文平臺也解決不了在一個系統內使用漢字、少數民族語言、日本和朝鮮的漢字問題.
4.POSIX是操作系統的一個標準。 Linux是符合POSIX標準的。而POSIX標準是采用國際化/本地化模式來解決多國語言文字的本地化。
 1999年8月底成立了Linux國際化工作組,開始了Linux國際化(縮寫為Li18nux)工作,同時也為中文本地化指出了正確道路。在這之前搞中文平臺,是因為那時還沒有Linux國際化組織,也沒有Linux國際化標準。而且Linux是芬蘭人發明,在美國成長起來的,開始也沒有想到它會如此成功,會走向世界,因此Linux以前也沒有考慮國際化的問題。Linux中文平臺對Linux在中國的發展和普及起了重要的作用,但它已完成了它的歷史使命。它只是一種暫時過渡的方法,是不得已而為之的方法,并不是中文Linux發展的正確之路。
二、Linux的國際化/本地化
國際化
(Internationalization,縮寫為I18n,即取首尾兩個字母,中間有18個字母)是規定在一個計算機程序內部的能力,使它適應不同的本地語言、本地風俗和編碼字符集。
國際化標準定義一組國際化的應用程序編程界面和用戶界面。
國際化主要包括用雙字節/多字節編碼代替單字節7位或8位編碼,使用統一的大字符集ISO 10646,建立本地化數據庫Locale DB,提供輸入、輸出服務(I/O服務)等內容。
1. 用雙字節/多字節編碼代替單字節7位或8位編碼
在國際化標準中,系統字處理中,必須以字符為單位,而不能以字節為單位。字符既可以是單字節字符,也可以是多字節字符,所以徹底解決了半個漢字現象。
 由于歷史的原因,計算機為了實現不同硬件和軟件系統之間數據傳輸的標準化,是使用7位編碼的,稱為ASCII(American standard code for information interchange)。ASCII是信息交換使用的美國國家標準編碼,它是美國的標準。ASCII字符集是用7個數據位表示的代碼,它用二進制數值來表示ASCII字符,代碼值的范圍在0到127之間。大部分基于PC的系統則使用八個數據位的擴展ASCII代碼。這樣可以使用額外的128個字符代表一些特殊符號、外語字符、圖形符號。
通信軟件的高位(第8位)是作為奇偶校驗位,用來檢測和改正通信錯誤。這種7位有效位的假定,滲透到很多軟件中,如電子郵件的實現。
隨著計算機應用的不斷發展,7位編碼已不夠了。雖然以后又使用8位的擴展ASCII碼,但256個字符即使對使用拼音文字的單文種的國家的用戶也是不敷使用了。雖然用了7位或8位能覆蓋基本字母,但還有多種多樣的符號及印刷元素,其數量遠大于256。各國拼音文字的字母和各種符號就有一萬個左右,漢字則有七八萬之多,使用雙字節(16位)編碼,也只能標識65536個符號。所以,如果想要計算機能使用多國文字,特別是使用漢字,則必須用雙字節/多字節。
如果說用兩位數表示年是計算機的千年蟲問題,那么用單字節編碼ASCII處理字符則是計算機文字處理的“千年蟲”問題。但單字節編碼的危害還沒有引起人們足夠的重視。
國際化的首要工作就是在系統字處理中,必須以字符為單位,而不是以字節為單位,即用雙字節/多字節編碼代替原來的單字節編碼,這就是用寬字符(wide character,為了統一地處理單字節字符和多字節字符,而采用統一編碼寬度的字符的內部表示)代替單字節字符。
2.使用統一的大字符集ISO 10646
使用統一的多八位大字符集ISO 10646是國際化的關鍵工作,也是國際化的核心工作。十分遺憾的是很多人對其重要性認識不足。
中國56個民族中使用漢字的人占絕大多數,有本民族語言的少數民族有17個。這些民族的文字屬性及字量相差很大,目前對不同民族文字采用不同的編碼方式。在中國使用人數最多的少數民族文字有七種:蒙古文、藏文、維吾爾文、哈薩克文、朝鮮文、彝文和壯文。其中蒙古文、哈薩克文、朝鮮文還須考慮和使用這些文字的其它國家如蒙古國、哈薩克斯坦共和國、朝鮮和韓國使用的編碼一致。中文信息處理主要是漢字,但不只是漢字。它也應該而且必須包括少數民族語言的文字處理這一重要組成部分。這對加強民族團結、提高少數民族地區的經濟、文化、科技發展,對于回擊外國反華勢力攻擊中國不重視少數民族的謊言,都有十分重要的意義。為了在一個計算機系統內同時處理漢字和多種少數民族文字,就必須使用既有漢字、又有各少數民族文字的統一大字符集。
海內外華人使用的漢字有很大差異,這種差異不只是反映在簡繁體和用詞的不同,更重要的是編碼和字符集不同,而要解決這個問題必須采用統一的大字符集。而且,國際化的要求也使得大字符集的使用更為迫切。
ISO 10646 信息技術通用多八位編碼字符集(Information technology-Universal Multiple-
octet Coded Character Set,縮寫為UCS)是國際標準化組織對全世界各國地區使用的書面語言文字及符號進行統一編碼的編碼字符集的國際標準。已于1993年5月正式審定公布了ISO 10646.1。我國根據等同采用國際標準的原則,也于1993年12月宣布為國家標準GB13000.1。
目前,該標準已收入了各國現行標準的文字符號近六萬個,可用于世界上多種語言的書面形式及附加符號的表示、輸入、顯示、存儲、處理、交換和傳輸。其中中文簡繁體漢字、日文用漢字、朝鮮文用漢字(簡稱CJK漢字)共20902個。
ISO 10646標準頒布后,又經歷了一系列的修改與擴充。經過中、日、韓等國的不懈努力,目前CJK漢字擴充集的6582個漢字、彝文和漢字結構符、漢字部首與構件編碼已納入BMP,蒙文和藏文編碼也取得重要進展。目前正在制定輔助平面(可收入漢字的標準,輔助平面2將納入CJK漢字擴充集Extension B的四萬多漢字及Super CJK的六萬多漢字。
其實,使用ISO 10646,中國是最大的受益國。但奇怪的是國外的公司為了軟件的國際化對ISO 10646十分積極,而我國的部分企業卻不重視。
但是國際化標準的制定進展太慢,可能是對“地方”的積極性沒有發揮或發揮不夠。特別是UCS中最大量、最困難的工作是漢字部分。在制定UCS標準時應充分重視中國的意見,并充分發揮中國的積極性。
在處理漢字字符集方面,考慮語言中的內在關系,哪些字是常用、次常用,如何排序(按漢語拼音、筆劃、部首),如何尋求最佳方案等,最有研究、最有發言權的自然是中國人。當然,海外華人和日本、朝鮮、韓國也都使用漢字,他們對漢字字符也很有研究,也要充分考慮他們的意見,但最大的用戶和市場是在中國。
國際化標準組織在漢字字符集中應以中國的意見為重,另外如IBM、SUN等大公司對漢字本地化也有很多研究,對國際化做出很大貢獻,也應多和他們協商。
每個國家執行的是本國的國家標準,國際標準只有變為國家標準時才能被該國執行。國際標準是通過多國的國家標準來實現的。
國際化與本地化是一個辨證的關系。國際化是為了解決軟件能在各個使用不同語言、不同風俗的國家和地區的編碼字符集都能使用的問題,而對計算機程序作出的某些規定。簡言之,國際化正是為了解決本地化。另一方面,本地化是國際化向特定本地語言環境的轉換,本地化要適應國際化的規定。
國際化標準組織要充分尊重各國標準化組織的意見。漢字共有七八萬個,從碼位的占有率來看是絕大多數,而且漢字又有簡體、繁體、日文用漢字、朝鮮文用漢字、韓國用漢字,可謂是最復雜的。國際化工作中最大量、最復雜的工作就是解決漢字本地化的問題,如果漢字本地化解決好了,國際化的工作就完成了一大半。漢字本地化解決得好壞是衡量國際化工作好壞的試金石。全世界使用漢字的人最多,漢字又是聯合國使用的文字,解決好漢字本地化意義十分重大。國際化標準組織應該格外重視中國標準化組織的意見,而不只是聽取各中文Linux廠商的意見。現在國際化組織的成果雖然已上網,但與中國標準化組織機構并未建立直接、暢通,有效的聯系渠道。
而且對中文(漢字)最了解的還是中國人自己。中文本地化離開中國人是搞不好的,國際化離開中國人也是搞不好的。
另一方面,中國的標準化組織也應主動和Linux國際化組織取得聯系,反映自己的意見,有問題和Linux國際化組織協商解決。
制定標準首先應考慮促進技術的發展,有利于整個行業的發展,而不僅僅是保護國內廠家的利益。事實證明單靠制定GB是擋不住國外大公司的。
經濟全球化,軟件國際化是趨勢,Linux也正走向全球,走向國際化。
全球有四分之一的人使用中文,沒有中國的“全球化”是不可想象的,所以Linux需要中國,而中國也需要Linux。解決好Linux的國際化和中文本地化對Linux的發展、對中國軟件行業都是十分重要的事,意義是十分深遠的。我們應抓住Linux機遇,從Linux的國際化和中文本地化突破,把軟件行業的國際化/中文本地化來一個比較徹底地解決。
這里有一個很重要的問題是對Unicode怎么看待和對關于字符集的國家標準(GB)如何與國際接軌而又充分體現對中文本地化最有利?
Unicode現在也是國際標準了,而不再只是幾家美國公司自己提的方案了。現在微軟的產品已支持Unicode ,還有SUN、IBM等大公司都支持Unicode 。
漢字不只是中國人民的寶貴文化遺產,也是亞洲人民的寶貴遺產,而且也是世界文明的共同財富。漢字在很多方面是優于拼音文字的。如漢字能使人引起聯想,而聯想是一切發明之母,學習和使用漢字有利于大腦智力的開發;使用漢字能以最小的篇幅表達最多的內容;漢字具有美感等。
我國既然決定了要遵循國際化標準ISO 10646并發布了相應的GB13000標準。共收錄了七八萬個漢字。是盡快過渡到UCS國際標準呢,還是緩慢過渡到UCS國際標準?我看還是盡快過渡好。因為多一個過渡性的GB,就會多一批需轉換的大量文件,也就是多一個大包袱。而且BMP已收錄了兩萬七千多個漢字,能滿足絕大多數人的使用。
應盡快采用國際標準的字符集和編碼方法,以后就只需逐漸補充字型(font)就行了。
關于字符集的標準,有關部門應把重點放在與國際標準有關組織建立聯系,把對漢字字符集、少數民族文字字符集和編碼的有關意見和他們溝通、協商,爭取在國際標準上反映出來。不要再搞新的字符集的GB了,以減少以后向國際化標準轉換時的包袱。
標準制定的重點應放在應用程序界面(API)的規范、標準的制定上。制定標準的一個重要作用就是促進應用程序的開發。十分遺憾的是這項工作進展太緩慢了。為了加快進度,最近中科院軟件所、紅旗軟件公司和一些關心API標準的人正在草擬一個標準初稿,準備供大家討論、修改,以盡快拿出一個草稿供標準化組織討論。

熱詞搜索:

上一篇:構筑穩健的中文Linux(下)
下一篇:GPL的中文Postscript字型安裝、原理及使用

分享到: 收藏
国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区
欧美少妇一区二区| 亚洲国产欧美在线人成| 99久久99久久久精品齐齐| 亚洲精品国产成人久久av盗摄| 欧美日本高清视频在线观看| 激情深爱一区二区| 18成人在线观看| 久久久久一区二区三区四区| 欧美在线观看一区二区| 国产精品18久久久久久久久| 午夜精彩视频在线观看不卡| 精品国产污污免费网站入口 | 蜜桃视频一区二区三区在线观看| 国产亚洲欧美色| 欧洲精品一区二区三区在线观看| 日日噜噜夜夜狠狠视频欧美人 | 色综合久久久久综合体桃花网| 亚洲电影一区二区三区| 精品国产a毛片| 欧美日韩高清影院| 色女孩综合影院| 国产jizzjizz一区二区| 奇米影视在线99精品| 亚洲欧美经典视频| 亚洲欧美综合在线精品| 国产亚洲成年网址在线观看| 91视视频在线观看入口直接观看www | 亚洲精品欧美专区| 欧美日韩一区国产| 色婷婷亚洲婷婷| 色婷婷av一区二区三区gif | 久久久精品国产免大香伊| 日韩一级二级三级精品视频| 欧美无乱码久久久免费午夜一区| 一本一道久久a久久精品 | 成人av在线观| av一本久道久久综合久久鬼色| 成人国产精品视频| 一本大道久久a久久综合| 91在线观看一区二区| 色网站国产精品| 欧美三级视频在线观看| 欧美精品黑人性xxxx| 欧美成人精精品一区二区频| 久久久久久久久久久99999| 国产精品另类一区| 亚洲狠狠爱一区二区三区| 日本不卡一二三| 成人av免费在线| 欧美一区二区三区思思人| 亚洲女爱视频在线| 亚洲自拍另类综合| 亚洲v精品v日韩v欧美v专区 | 亚洲黄色录像片| 国产综合色视频| 欧美日韩精品高清| 综合久久久久久久| 国产精品一二三区在线| 欧美三级韩国三级日本三斤| 久久精子c满五个校花| 视频在线观看国产精品| 成人av网站在线观看| 日韩一区二区精品葵司在线| 国产精品青草综合久久久久99| 亚洲成精国产精品女| 91在线播放网址| 国产精品美女久久久久久久| 激情文学综合网| 欧美激情中文字幕| 丰满亚洲少妇av| 亚洲国产精品ⅴa在线观看| 国产一区二区三区免费看| 91精品国产aⅴ一区二区| 亚洲韩国精品一区| 欧美日韩电影在线播放| 亚洲成人一区在线| 欧美久久久一区| 琪琪久久久久日韩精品| 91精品免费观看| 另类欧美日韩国产在线| 欧美电视剧在线看免费| 国产又粗又猛又爽又黄91精品| 精品国产91久久久久久久妲己| 亚洲欧洲99久久| 欧美日韩国产不卡| 国产精品亚洲第一| 中文在线免费一区三区高中清不卡| 懂色av一区二区三区免费观看 | av亚洲精华国产精华| 曰韩精品一区二区| 欧美一区二区三区系列电影| 国产美女精品人人做人人爽 | 欧美男男青年gay1069videost| 亚洲国产精品精华液网站| 日韩精品在线看片z| 成人午夜免费视频| 午夜精品一区在线观看| 国产精品你懂的在线欣赏| 欧美亚洲高清一区| 懂色av一区二区三区免费观看| 亚洲国产精品精华液网站 | 7777精品久久久大香线蕉| 成人av手机在线观看| 亚洲自拍欧美精品| 555www色欧美视频| 中文字幕欧美三区| 亚洲欧洲另类国产综合| 日韩精品最新网址| 欧美性猛交xxxxxx富婆| 99视频精品全部免费在线| 国产剧情一区二区| 久久国产三级精品| 亚洲成人免费影院| 午夜精品久久久久久久99水蜜桃| 亚洲视频狠狠干| 自拍偷拍欧美精品| 亚洲成a人v欧美综合天堂| 亚洲色图欧美激情| 亚洲福中文字幕伊人影院| 亚洲精品国产成人久久av盗摄| 国产亚洲精品超碰| 亚洲精品国产视频| 天堂蜜桃一区二区三区 | 欧美日韩国产三级| 日韩一区二区精品葵司在线| 在线视频一区二区免费| 色吊一区二区三区| 91精品国产综合久久精品性色| 日韩欧美久久一区| 中文字幕精品—区二区四季| 亚洲精品视频在线观看网站| 亚洲男人天堂av网| 性做久久久久久久免费看| 国内精品嫩模私拍在线| 成人激情av网| 欧美精品第1页| 日韩视频一区二区在线观看| 国产婷婷色一区二区三区四区 | 色偷偷一区二区三区| 欧美哺乳videos| 亚洲美女屁股眼交3| 久久99精品一区二区三区三区| 日本强好片久久久久久aaa| 国产成人精品www牛牛影视| 欧美色视频在线| 国产亚洲精品7777| 国产精品成人一区二区艾草 | 国产精品99精品久久免费| 国产电影一区二区三区| 91久久精品一区二区三| 久久久久久久久久久久久久久99| 亚洲va欧美va人人爽午夜| 99久久综合99久久综合网站| 久久综合给合久久狠狠狠97色69| 亚洲黄色性网站| 色av成人天堂桃色av| 国产精品欧美久久久久一区二区| 一区二区三区av电影| 国产精品一级在线| 久久久高清一区二区三区| 精品一区二区在线播放| 欧美日韩在线播| 天堂一区二区在线| 精品成人私密视频| 亚洲第一电影网| 欧美肥大bbwbbw高潮| 午夜精品久久久久久久99樱桃| 91色.com| 国产精品88av| 国产精品情趣视频| 在线影院国内精品| 麻豆91精品91久久久的内涵| 2021中文字幕一区亚洲| 成+人+亚洲+综合天堂| 中文字幕一区二区不卡| 在线观看国产精品网站| 欧美主播一区二区三区| 日本少妇一区二区| 亚洲免费视频中文字幕| 日韩精品自拍偷拍| 色天使色偷偷av一区二区| 国产精品影视在线| 久久电影国产免费久久电影| 亚洲国产另类av| 性久久久久久久久| 国产精品色婷婷久久58| 久久婷婷一区二区三区| 日韩欧美国产一区二区三区| 色噜噜狠狠色综合欧洲selulu| 99精品久久只有精品| 亚洲国产精品ⅴa在线观看| 久久久久久久久一| 欧美日韩一级二级| 在线一区二区三区四区五区| 91网址在线看| 91麻豆福利精品推荐| 色综合久久天天| 色婷婷一区二区三区四区| 欧美最新大片在线看| 欧美酷刑日本凌虐凌虐|