汉字基因十节课(中文人工智能理解核心基础教程)

本教程转贴自 朱邦复 先生(仓颉输入法发明人、中文电脑之父)发表于个人工作室网页内容

简介:

即日起,拟在本网讲解“汉字基因”,但仅限“理论”,设计细节恕不能公开。

由于老朽之时间、精力有限,网友发问请勿离题(针对已讲者),明察慎思(已讲者 务需领会)。至于能讲多少、多久,端视网友程度而定(多达千讲,少至一言),若有来 问未登,必系不合规范,自知可也。

网主 2001-12-09

注:

①若文中有??或无法显示字形,是因BIG5系统无该字,原文实有。
②汉字基因分十节,受限网络编排格式,讨论区版本分为十二讲。
③汉字基因十二讲自2001-12-09开讲,2002-01-09为止,计一个月。

编按:《2017 漢字基因字典》已上线

   https://github.com/ChuaTony/Chinese-character-gene-dictionary

 第一节 汉字基因


一、前题

“汉字”系先圣前贤历经数千年、将日常生活“所知所识”、浓缩在“图、象”中、 以供同种同族人民相互沟通之“意识工具”。换句话说,汉字系中国汉民族的“思维结晶 ”,亦可谓为“思想载具”。

是以,汉字不仅仅是一种“符号”,也不仅仅是一种能够发声、具有意义的“文字” ,而是具有“生命”的“意识流”,代表着中国人与宇宙互动的“心路历程”。古人说“ 文以载道”,良有以也。

“基因”者,基本因子也。所谓科学,无非分门别类之学,以探求事物之极致。既至 其极,可称为该事物之“基本”矣,再问“为何”,则有其“因子”焉(以基因排列组合 ,用其功效,是称“科技”)。

物质之基因久为人知,是以物质文明昌盛;近年生物基因亦已被发现,生命科技势将 大行其道。若汉字基因被证明无误(用“易芯”之硬体证明之),人类之思想将不再是唯 心之论,可谓“智慧”也。

二、源流

五千年前,中华民族之祖先,于观天察地之际,发现“时有序,物有律”。由于农业
社会之生存环境安定,先民深究之下,发现了“绝对分类”之法则(非开即关,即今日之
二进位制)。宇宙原本混沌,一分为二,称“动、静”两仪,两仪再分四象,四象而得八 卦。这种观念,正是分类的结果。

所谓“绝对分类”,可以涵盖宇宙中之万有,只要站在一定之立场,分类合理,就可 以代表事物之真实。

先民之立场,是以“人类”之观察为出发点,试证:
1,观察者为人,以其“感官”所接受之外界刺激为分析对象。
2,感官是生命体因应生存环境而进化者,故仅能感应“变化”,是称“易”。
3,刺激依时序先后,其前级刺激与后级刺激相比较,因不同而有变化。
4,前级与后级刺激之变化(某一限度内),仅具“有、无”两类。
5,有变化可假定为“动”,无则为“静”。
6,故一分为二之“绝对分类”,对人类立场而言成立。

先民对这种“变易”之理,作了大量的印证,从而创作了一种具有此类“象征”的文 字,是谓“甲骨文”。经过几千年的演变,遂形成“汉字”。

三、结语

将“变易之理”与汉字相对应,一一寻求其“根”,并分为若干“层次”,以作“绝 对分类”,求出其“最大公约概念”、以及“最小公因象征”,是称“汉字基因”。

第二节 汉字基因分类

本讲涉及电脑之二进位结构,此为基本常识,欲上层楼,不可不知。特将二进位、十 进位与十六进位转换如次:(h为十六进符号)

          二进位      16进  十进
        0000  =  00h  (0)
        0001  =  01h  (1,于二进位时,0已进位成1。)
        0010  =  02h  (2)
        0011  =  03h  (3)
        0100  =  04h  (4)
        0101  =  05h  (5)
        0110  =  06h  (6)
        0111  =  07h  (7)
        1000  =  08h  (8)
        1001  =  09h  (9)
        1010  =  0Ah  (10,十六进以A取代之。)
        1011  =  0Bh  (11,十六进以B取代之。)
        1100  =  0Ch  (12,十六进以C取代之。)
        1101  =  0Dh  (13,十六进以D取代之。)
        1110  =  0Eh  (14,十六进以E取代之。)
        1111  =  0Fh  (15,十六进以F取代之,进位为10h。)

对电脑而言,二进位相当开关,但因数目太长,特以十六进位数字代表之。

一、基于基因分类规律,太极分两仪,两仪分四象,四象分八卦。

    汉字基因首分本末,次具性质,如次:
        本:思维-
                  性:概念
                  质:常识
        末:应用-
                  性:符号
                  质:定性
    又基于二分法之特征,取其八次元,各得256种:
        概念基因256种,从分类来看,有八个层次。
        常识基因256种,仓颉字首、字身之定义值。
        符号基因256种(涉及工业设计,不宜公开)。
        定性基因256种(涉及工业设计,不宜公开)。

二、概念分类:

由于正值实证阶段,尚在不断改进中。以下分类与原载于《汉字基因工程》中之内容 略有不同,参考则可,但请勿混为一谈。

下表之最左侧标题为“层次”,当二分至三层后(八种认知),其性质已渐模糊。至 四、五层后,改用“四别”、“八类”(其中奥妙尚请自参)。

其理暗合西方“混沌理论”之“周期三分裂=乱数”,盖人类认知受限于“三才结构 ”(例如空间仅有三维),“概念”不可能如“数字”之不断二分也。

于分类概念之前,有0或1,以代表“二进位”值。至“八类”时,改采0至F之“ 十六进位”值,本文不负责教导此类细节,不懂者略之可也。

下文之分类表为系统总览,由分类中确定各种性质。

四别        八类(即为概念基因256种,因受版面限制,特作平面展开)


三、用例

若有一字属于“乐器”,其十六进位值为3A,展开为二进值:00111010( 每一数字为一位元)。依其前后顺位,再查分类表,可得“分类共性”:

    第一位元=0  为静态,属于客观、外在------是人可“用”者。
    第二位元=0  为具象,有体、形、色、质、性、量-是人可“识”者。
    第三位元=1  为人造,多属几何图形,有功能---是人可“知”者。
    四五位元=11为工作,必有“体、用、因、果”--是人之行为。
    余三位=010共为乐器(何种乐器以八位元“定性基因”区别之)。

再如该字为“箫”:其常识基因为“竹、肃”(仓颉字首、字身),“竹”为材料, 常识定义=坚、直、管状、中空、可出气、有孔;“肃”=严肃,音。

是以,再加定性之八位元,共十六位元,就能将任何汉字定义得清清楚楚。事实上, 汉字虽有数万之多,但除了“古用字”、“异体字”、“错讹字”,以及作为符号的“名 词专用字”之外,具有“意义”者不过六千而已。

 第三节 汉字基因之功能

一、基因因子

汉字基因是人类思维的精华,是资讯系统整合之基石,是中华文化优秀的明证。它具有强大无匹的机能,经过分门别类、归纳整理后,提炼出“形音义”之“因子”,设计成 “码”,是称“仓(苍)颉系统”(以纪念造字之前贤苍颉)。

“码”系中性符号(相当于代数中之“变数”),可在“基因”之统一结构下,根据 不同之应用,发挥不同之功能。

在“汉字”中有:字母、字形、字序、字音、字辨、字义六大要素,其“基因”中可 以析出各要素之“因子”。

“字母因子”即仓颉二十四个字母;“字形因子”则载于CBFLABS.网页“著作下载”
栏:“仓颉输入法与中文字形产生器”一文中,供字库造字用;“字序因子”相当于拼音
文字的字母顺序,供大量资料查寻用;“语音因子”即各种音标符号;“字辨因子”乃仓
颉字母及其辅助字形;“字义因子”即为“概念基因”,乃中华文化最精炼之瑰宝,为“ 沟通理解”的不二法门,其纲要已如第二节。

此六种因子,皆属“汉字基因”范畴,以“苍颉系统”概括之,作为应用介面(盖于 实用中,尚有两种基因涉及“智识产权”,恕不能公布)。

二、汉字六大要素与其因子

1,输入:文字输入-仓颉字码(即字母因子)。

二十多年前,本人率先发表“仓颉输入法”,以供中文电脑文字输入之用。实则 当时“汉字基因”观念已经成形,唯个人力有未逮,不得不逐步推出。

2,输出:文字输出-仓颉字形(即字形因子)。

电脑乃一资讯处理工具,所处理之结果,必当有以示人。故以“向量组字技术” ,利用字形因子,以程序将“码”释为字形输出。

3,查寻:文字排序-仓颉字母(即字序因子)。

过去因无电脑,文字序列全靠记忆,其效能不彰。今于大量资料(比如亿兆笔) 处理时,查寻不仅要快速,且应与人之习惯相符(拼音文字唯一优点,即其“字母” 之排序,观“字典”即可知之),故而厘定“仓颉字母”。

4,语音:形声法则-仓颉字身(即语音因子)。

汉字百分之九十来自“形声”,声符多为字身,有一千三百多个。本系统仅取其 “本音”(如:诣取旨音,昙取云音),以求系统完整(此乃革命也,有“学问”的 “利益既得者”必将反对,但不作此图,汉字将永遭诟病)。

5,辨识:文字扫瞄-仓颉字码(即字辨因子)。

辨识与输入之对象相同、处理相反。故扫瞄之形可转成向量,再由向量得出仓颉 字码。既由字形得到字码,即称辨识。

6,意义:概念基因-概念分类及仓颉字首字身定义(请见第一节)。

概念分类为人类思维基因,再加上仓颉字首、字身之常识基因,以及文字之体用因果、性质关系,即为文字对人之意义。

当概念基因之观念发扬光大后,汉字将如同“科学”一般,易学易用。至时,中华文化势将为举世所接受,以为人类造福。

三、整合应用

在资讯时代,由于应用工具的成熟,人际沟通的效率极为重要。

文字语言是内容的载具,诸如文字语音的输出入,内容的认知与理解等,必须都能结 合在一个系统之下,始能得到最大的效益。否则,在资讯处理上,各种功能独立,互无交 集,其结果必然是庞大无序,令人不知所从。

此一统合之体系,即为“苍颉系统”。本实验室之主要课题,即将之设计在“处理中 枢”中(即为目前正在设计之“易芯”晶片)。是则,人与人之间,可藉此客观系统相互 沟通,其意义大矣哉。

第四节 汉字基因之应用

一、汉字系供人与人沟通之用,其沟通之条件有:

1,两个或两个以上独立之个体。

人生之初,无知无识,成长于社会环境中,端赖与其他个体之沟通以学习。待成 长后,即令是个人脑海中的思考,其认知概念亦皆来自“前人”。

人不论聪明才智、思想认知,个体仍是个体,彼此间需要沟通。在人类社会中, 由于大众的参与,用以沟通的认知概念必然会随着时代环境而日益精进。

2,各个体主观之认知,必须经由一客观之管道,以资传达。

人之感官在时、空变化中,接受到各种不同的刺激,而形成主观认知。但因人类 具有相似的感官,其功能亦同,经过社会群体之相互传达,则可称为客观。

在互异的主观个体间,人的认知是指藉彼此共有的、基本的、可组合或分解的概 念因子沟通,以使主观与客观达到一致的认知。

3,“一致的认知”是沟通的目的,即为“理解”。

所谓“一致的认知”,可视为在不同的系统间,有完全符合的联接介面,且可经 由一种相同或相似之基因联接之。

同理,如文字为载具,认知即为载体;如二进位分类为载具,则基因为载体。若 将载具与载体视为两种系统,则人与所理解者亦应具有符合的联接介面(载具为载物 之具,载体即为所载之物)。

结论是,欲达到相互“理解”之目的,在系统与系统之间,必须有完全符合各系 统之联接介面(载具)或相似之基因(载体)(如在空间中,物体有光,视觉能接受 之;因空间为介面,介面为载具,光为基因、为载体)。

二、如果以资讯系统的立场来说,可以说:

1,人类利用“语言、文字”相互表达各自的经验及思维,于表达时,必须透过某种 机制,在“输出、输入”之程序下,将资讯传给另一机体。

2,以电脑为例,其内部处理之机制是“二进位数码”(二进位相当于一组0与1之
“开关”,利用电子特性,可以设计成稳定可靠的“硬体”,同理也能以软体程 序,随意改变之),设若人所认知之“概念”也能设计成相同之“二进位数码”
,且无损人对概念之认知,则人与电脑必可藉此二进位数码机制,相互沟通。

3,在第二节中,概念分类表即为二进位数码机制,所以可供电脑“理解”。同时, 人也可以根据这种分类,由其结构及基因、理解到汉字的微言大义,进而提升个 体的思维能力。

三、以实际例证,更进一步说明汉字基因之应用关系:

1,输入、输出:

1-1,电脑键盘输入:

一种输入方法,其目的系为了令电脑认知者。一般人以为,只要编一种代码,把文字输入即可。实则,如果在编码之际,未能建立有效的联接介面,且无基因以供认知,则不能达到相互沟通之效益。

电脑屏幕输出:一种文字显示,其目的系表达电脑所认知者。同前述之理,如仅系字形的显示而无沟通目的,其意义不大。

1-2,语音输入:

将语音转换成“文字”,如未经过“理解”,则不能称之为“辨识”,充其量只是“列表圈选”而已。语音是人类最方便之沟通介面,未来电脑不可或缺,中文电脑必须藉汉字基因彻底解决之。

语音输出:语音合成似较简单,实则不然。因语音中包含了“情绪变化”,而情绪变化又涉及概念理解,仍然与汉字基因密不可分。

1-3,图形输入:

汉字本系图形文字,虽经历代改良,使之“符号化、中性化”,而丧失了原形。但是“图形定义”中最重要的因素,是为“图形范围”(从事图像处理之工作者,无不视“图像分割”为难事),在汉字中,却保留下来了。这种“方块”字,一字一图,泾渭分明。据此,可以分析“图形基因”,并以之编码,是则,图形亦可视同文字编码输入。

图形输出:图形所占之信息量过大,但在基因处理下,空间效率可增进千、万倍。资讯时代之到来,系因“类比讯号”之“数位化”;而下一个时代当图形基因化后,其功效不言可喻也。

2,时空效率:

人是无效率的动物,因此才会对电脑有强烈的依赖性。而电脑效率之高低,目前
在西式的商业体制下,是建立在其软硬体的设计上。软件工程师为了提高其“经济效
益”,以便于“大量生产”,全面牺牲了使用者的“操作效率”,一律采用“高阶语 言”(一种易学易用但笨重无比的程序工具)。

为此,欲求当前的电脑理解人意,是绝不可能的梦想(美国举全国之力,由19 50年发展至今,连门都未入)。

汉字基因所占的空间极小,又能直接与硬件介面联接,欲令电脑理解人意(假如 能设计成功),其时空效率比诸当前的电脑,将高出“无穷大倍”。

3,设计方案:

“理解”对人类意义重大,如果设计成为“软件程序”,极易遭“骇客”窜改( 如以黑为白,以非为是,不过改一个位元即可)。为了避免这种祸害,唯有设计成为 硬件,以符合“基因”的结构,也唯有采用基因技术始能够达成理解目的。

第五节 汉字基因的三维结构

“三维结构”:天=规律,地=应用,人=认识。三者缺一,汉字基因即无从理解。 也就是说,汉字基因之能够供人理解,实因其结构得以贯通“天人”也。

一、天:常识

生命体历经千万年的进化,因为适应了地球环境,而有了“遗传本能”的性质。人类 更进一步,又有“概念”,对环境规律加以观察、整理,并代代相传,形成了“生命、生 存、生活”的基本认知,是称“常识(日常生活必备的认识)”。

汉字基因即为思维基因,而人之所思所维者,率皆来自常识。也可以说,人之思维, 不过是以符号联通常识,以供生存、生活的灵活应用。由于常识的应用,人类文明得以飞 速发展,进而萌生知识,最后回归宇宙智慧的本体。

于汉字中,“部首、字身”即相当于“常识分类”,只要稍作补充,诸如合力分力(
地心引力、摩擦力、作用力等)、比重向量、数系关系、能量程度、运动轨迹等之定义即
可。这些关系的界定需要各种专家(几乎含盖了各行各业)齐心协力,共同研究。然而,
说来简单,西方讲究“自由思维”,要想得到“共识”,等于是“天方夜谭”。至于东方 ,百年来在美人洗脑下,早已“乐不思蜀”了!

汉字是几千年来,无数的先圣前贤,在无私的奉献下,流传下来的无价瑰宝。基于“ 约定俗成”原理,“约定”乃指使用者,“俗成”则以“常识”为依归。历经数千年、数 十亿人民的严酷考验后,迄今兀立不倒,足证汉字绝对客观可靠。

二、地:体用因果

“体用”自我国秦汉时已有定论,儒家非常重视体用关系,是“举一隅以三隅反”之 不二法门。“因果”系“体用之动态”,在一过程之中,因体用之变化,而产生用体之果 。说文解字谓汉字系约定俗成,其约定之基础,即为体用因果。

兹以无线电话为例,说明“体用”关系:
无线电传输分“载具、载体”两大类,如载具=体,则载体=用。
电话为体,电波为用;
电波为体,音讯为用;
音讯为体,概念为用;
概念为体,感受为用;
感受为体,能量变化为用。

对汉字的理解,即为先“辨识”所代表之“体”,再得到该体之“用”;或知其用, 反求其体。以上两者,无非“体用关系”,故若知“概念之体用”,即为“理解”。

例:有一机器,能见体知用,如:
闻电话铃声,知应取其话筒,置于耳边,听之答之。
见用知体,如:
再知欲告一事,通过电话拨号,与对方通话。
此例涉及一系列“物理、生理、心理常识”,若能达成,即为理解。

因果则依时序开展,始态为因,终态为果。
体用因果间之关系,必然遵循常识规律(知识例外)。

三、人:认知

人对基因之“认知”,不外“人事时地物情理法”八种对象。其中细节非常复杂,兹 概述于下,以供参考:

对人之认知:形貌,个性,能力,经验,背景关系,意识型态,当前状况,利害。
对事之认知:人、物之变化,时、地之终始,情、理、法之体用因果。
对时之认知:连续性,急迫性,影响性,变化性。
对物之认知:性质,功能,价值,主权。
对地之认知:地缘,环境,距离,安危。
对情之认知:利害,喜恶,程度,隐显。
对理之认知:环境,对象,规律,基础,分析,归纳。
对法之认知:立场,目的,策略,手段,利基,得失。

因此类信息数量庞大无比,故唯有记载“基因”,始有效率。

汉字基因之结构即相当于三只不可或缺之基脚:“常识”是事物的规律;“体用因果”则是概念的应用;“人事时地物情理法”提供人的认知介面。


第六节 汉字基因的分类层次

汉字基因的概念分类已如第二节,分类时采用二分法,共分五层。分类采双段制,初
段一分为二,二分为四,四分为八;次段八分为32,再分至256。基于二进位的特性
,256种的“八个位元”中,每一位元均代表着分类的信息,故使用时效率极高(于第 二节例证中,曾以“箫”说明之)。

每层各有一“词组”定义其范畴,其性质承上启下,累为系统。兹一一说明如次:

一、立场有“二维”:
概念为供传达信息之载具,载具必有一立场,于立场中传达特定之信息。
1,其静态者指客观事物,是立场之体。
2,动态则为主观变化,是立场之用。

二、现象有“四象”:
体有具象、抽象,用有认识、反应,皆可观察、辨知。
1,具像有“体、形、质、量、色、位、能、价”等因子,可供辨识、应用。
2,抽象有“象、数、性、征、关系、意义、条件、利害”等因子。
3,认识有“刺激、分辨、状态、感受、程度、印象、情绪、希冀”等。
4,反应有“能力、意念、目标、动作、功效、判断”等。

三、认知有“八知”:
具象者分:本存,人造;抽象者分:规范,应用;认识者分:感知,状态;反应者分:能力,经验。
1,本存者多为“自然形”,无特定机能。
2,人造者多为“几何形”,有特定机能。
3,规范者多供辨知,系人为假设者。
4,应用者多系对象,系现实环境之代称。
5,感知者为因觉而知,由接收刺激到产生印象。
6,状态则为所知之果,辨知各种变化的状态。
7,能力指生命本具者,由官能进至智能。
8,经验则需要学习,包括做事待人等行为。

四、四别得三十二属:
本存者有:本体、植物、肢体、动物。
人造者有:食衣、住行、起居、工作。
规范者有:定义、根源、语法、现象。
应用者有:讯息、利害、事理、关系。
感知者有:视觉、感觉、心绪、印象。
状态者有:动态、化态、界态、识态。
能力者有:官能、体能、功能、智能。
经验者有:生活、沟通、处理、待人。

五、八类分256种:
        客观┬具象┬本存┬本体┬源体;质体;宇体;形体。
             │     │     │     │界体;水体;能体;命体。
             │     │     │植物│食用;菜用;果用;体用。
             │     │     │     │观用;工用;利用;命用。
             │     │     │肢体│体位;体构;体表;体质。
             │     │     │     │体感;体功;体控;体动。
             │     │     │动物│用类;飞类;行类;水类。
             │     │     │     │爬类;虫类;化类;称类。
             │     │人造│食衣│食物;食肉;食感;食式。
             │     │     │     │衣物;衣用;衣位;衣源。
             │     │     │住行│居用;住用;公用;化用。
             │     │     │     │建体;通体;构体;行体。
             │     │     │起居│食具;炊具;容具;盛具。
             │     │     │     │视具;用具;住具;废具。
             │     │     │工作│文器;知器;乐器;质器。
             │     │     │     │农器;工器;机器;武器。
             │抽象│规范 │定义│类词;序词;数词;时词。
             │     │     │     │位词;度词;币词;量词。
             │     │     │语法│意词;动词;代词;副词。
             │     │     │     │语词;声词;连词;介词。
             │     │     │根源│本源;性源;视源;感源。
             │     │     │     │知源;人源;宗源;居源。
             │     │     │现象│本象;表象;形象;感象。
             │     │     │     │质象;固象;液象;气象。
             │     │应用│讯息│资讯;识讯;视讯;事讯。
             │     │     │     │文式;文体;文件;文据。
             │     │     │利害│意利;公利;性利;财利。
             │     │     │     │意害;病害;体害;命害。
             │     │     │事务│法务;公务;组务;职务。
             │     │     │     │事务;业务;界务;源务。
             │     │     │关系│本系;姻系;人系;宗系。
             │     │     │     │通称;行称;人称;源称。
        主观│ 认识│感知│视觉│光状;色状;明状;性状。
             │     │     │     │形状;体状;势状;态状。
             │     │     │感觉│食觉;触觉;质觉;体觉。
             │     │     │     │意觉;听觉;知觉;思觉。
             │     │     │心绪│意感;源感;人感;物感。
             │     │     │     │良感;触感;害感;恶感。
             │     │     │印象│意性;质性;体性;行性。
             │     │     │     │良性;表性;感性;恶性。
             │     │状态│动态│转动;位动;形动;势动。
             │     │     │     │源动;力动;表动;水动。
             │     │     │化态│宙态;宇态;能态;势态。
             │     │     │     │容态;事态;生态;命态。
             │     │     │界态│通界;连界;触界;形界。
             │     │     │     │体界;状界;向界;量界。
             │     │     │识态│时识;事识;形识;状识。
             │     │     │     │意识;力识;判识;利识。
             │反应│能力 │官能│食况;观况;声况;嘴况。
             │     │     │     │意理;情理;生理;人理。
             │     │     │体能│动处;动止;动体;动式。
             │     │     │     │动形;动状;动向;动类。
             │     │     │功能│手动;手触;手控;手刃。
             │     │     │     │易形;易状;易向;易表。
             │     │     │智能│观智;辨智;思智;知智。
             │     │     │     │述智;谋智;判智;控智。
             │     │经验│生活│炊事;住事;居事;行事。
             │     │     │     │农事;工事;育事;物事。
             │     │     │沟通│意通;理通;态通;利通。
             │     │     │     │情通;感通;气通;恶通。
             │     │     │处理│处意;处行;处位;处事。
             │     │     │     │处物;处财;处力;处恶。
             │     │     │待人│用人;知人;处人;命人。
             │     │     │     │事人;利人;害人;恶人。

注:汉字基因虽本存于文字中,但惜前人仅知“约定俗成”,未作“系统整理”。本 工程难度之高,涉及知识之广,已臻人智之极,非比等闲焉。

本人从事研究数十载,从无到有,点滴聚歛,原稿修改迄今,已不下三十余次之多。 为文至此,又有新猷,现公之于世,但供有心人士参考,绝非最终定论也。

由于研究尚在持续进行,概念分类经常有所调整。为了供有心人士参考,此分类表曾经多次公开发表(自1984年起,出书三次,在台大企管系公开演讲一次,北京工程学 院主办之“汉字基因工程”发表会一次,每次都略有改进)。

但因举世迷信美国人的技术,美国人不懂汉字,所以汉字便失去了应有的价值!炎黄子孙之不争气如此!贫弱之道如此,是矣!

各层分类之性质略述于此,仅供参考,欲有所成,须自行努力也!

256种概念,在8000字(有意义者)中,每种中平均有概念31个,最多者约 50个,最少也有二十。每一概念常有多种分类,最多为四次。

兹于256种分类中,各取十个概念,列举如次:

二进位值     十六进位
0        客观   静态
00       具象   体、形、质、量、色、位、能、价,辨识、应用。
000      本存词  自然本存,有形、体、色、量、位,可辨识
00000    本体+性质、功能、价值,供应用
00000000=00源体:金木水火土碳磷砒氢氧氮
00000001=01质体:材釉埴墣壤赭墡垩卤舄泥
00000010=02宇体:陆原塽坪坎坷岳岳峦岫峰
00000011=03形体:岩石磐碌砂沙玉琨琼瑶瑷
00000100=04界体:岛洲屿渚礁矶岸湄崎墈滩
00000101=05水体:洋海湖泊荡潭淀沼泽薮池
00000110=06能体:樵柴薪木碳煤炭酒油沼焱
00000111=07命体:人兽禽畜牲鸟鱼贝虫树藤

00001    植物+生命、特性、机能
00001000=08食用:粮秣糇谷糠禾稻穧糯粳稑
00001001=09菜用:蔬葱菜萝卜蒜薯匏葫芦茄
00001010=0A果用:葡萄枇杷柿蕉榴柑橘橘柠
00001011=0B观用:菊兰昙玫瑰棠荷松柏榕枫
00001100=0C体用:干杆柯梃标株枚稿穰黀秸
00001101=0D工用:茅荆棘楚棕榈竹杉槐梓藤
00001110=0E利用:桼梧桐橡蔗菸桑栗棉麻麻
00001111=0F命用:花英华蕊絮苞秀穗果果核

00010    肢体(可动)+结构、部位、功能
00010000=10体位:身体躯躬背头首面脸脖颈
00010001=11体构:骨骼骷髅髑脊颅额囟颐腮
00010010=12体表:甲角犄鳞壳皮肤胼胝革韦
00010011=13体质:丝胶膟膏血衃蔑髓腺乳奶
00010100=14体感:脑心意眼睛目眶瞳眸睑耳
00010101=15体功:脏心肺肝脾胰肾腑胃胆肠
00010110=16体控:膊髆肩臂膀胛肘胳胳肱腕
00010111=17体动:腿胯髀髋䏝髌膝腓胫脚足

00011    动物(自动)+生命、特性、机能
00011000=18用类:鸡鸭鹅鸽鴳鹌兔猪羊牛豚
00011001=19飞类:鹤鶤鹭鹳鸿鸥鹈鹕鸳鸯鹦
00011010=1A行类:猿猴猩狒狐狸狼狈豹虎狮
00011011=1B水类:腽肭鲸虾蟹蜗蚌蛎蚝蚬介
00011100=1C爬类:蛇蟒蝮蚯蚓蝎蝎蜈蚣蜘蛛
00011101=1D虫类:蛾蝴蝶蚊蜉蝣蝇蟑螂螟蚱
00011110=1E化类:精卵蛋胚胎蛹蛆孑孓蝌蚪
00011111=1F称类:龙凤麒凰麟鲲鹏角夔饕餮

0        客观   静态
00       具象   体、形、质、量、色、位、能、价,辨识、应用。
001      人造   人为环境,几何形,结构、位置、功能、效用。
00100    食衣+特性
00100000=20食物:饭米面饵粥糜糊糕饼粿馒
00100001=21食肉:鱼肉脍膴胾脔醓醢臐膰胙
00100010=22食感:盐糖醋酱油茗茶啤酒馅餖
00100011=23食式:膳餐宴伙馐斋荤素筵酒席
00100100=24衣物:冕帽盔簦鑐铠韘韝髲鬄纂
00100101=25衣用:衣服衫襌袄袍褂褧衮裳裤
00100110=26衣位:鞋屦履屣屧屐屉靴舄袜蹝
00100111=27衣源:麻棉丝毛皮革绒缃巾幂缦

00101    住行+特性
00101000=28居用:城郭墟庄院庭园场埕坪场
00101001=2A住用:寓房屋舍宅室墅楼厦庐堂
00101010=29公用:馆店铺栈肆摊窑寮塔寺庙
00101011=2B化用:厝墓坟茔冢墦冥圹窀穸冢
00101100=2C建体:墙壁垣堰堤塘坝栏杆栅阑
00101101=2D通体:径道路途阡陌埂嶝衢胡衕
00101110=2E构体:轨榫扃闩轮轴毂辕辖轫楫
00101111=2D行体:车跸机艇船舟舰筏舳舻舢

00110    起居+特性
00110000=30食具:筷箸梜叉匕碗盘碟钵罏瓢
00110001=31炊具:炉灶垆炉策锅甑釜錡镬壶
00110010=32容具:缸桶坛盆罐槽盂罐陶鬲瓶
00110011=33盛具:箱匣盒筐函箧篮篓箪筒袋
00110100=34视具:钗簪笄珈镯钏环璧佩圭玦
00110101=35用具:线线缕绳拐杖棍棒镜鉴梳
00110110=36住具:桌台案椅凳凳座几架橱柜
00110111=37废具:屁尿屎粪耵聍垢渣滓籸泔

00111    工作+特性
00111000=38文器:笔聿墨稿纸簿册卷帙尺签
00111001=39知器:球棋骰卢牌弈傀儡偶毽箾
00111010=3A乐器:锣钹铃鼓梆钟镛笙箫笳管
00111011=3B质器:陶瓷玻璃蜡漆瓦砖鍱钢铣
00111100=3C农器:锄耙耖犁铲锹镐镰刈网罗
00111101=3D工器:锉刨镘圬铗钳镊砧椎锥钉
00111110=3E机器:链镣键鐍镮枢纽钥匙锒锁
00111111=3F武器:弹炮枪炮枪弓戟干戈剑盾

0        客观
01       抽象   象、数、性、征、关系、意义、条件、利害
010      规范   多供辨知,系人为假设,以符合环境者。
01000    定义+范围
01000000=40类词:界门纲目科属种类干兑离
01000001=41序词:甲乙丙丁戊己庚辛壬癸子
01000010=42数词:一二三四五六七八九十廿
01000011=43时词:年季月日时分秒前昨今明
01000100=44位词:上下前后左右内外中东西
01000101=45度词:里哩码米咪尺寸里尺寸分
01000110=46币词:块元毛角毫分镑锾两贯吊
01000111=47量词:趟回次番度服剂顿口份届

01001    语法+条件
01001000=48意词:必定应该得能够要愿甘肯
01001001=49动词:是为然即乃系有非否匪甭
01001010=4A代词:我洒俺敝予余咱朕孤你妳
01001011=4B副词:偬紧遑忽乍骤溘突蓦猝渐
01001100=4C语词:几奈曷奚何讵况之乎也者
01001101=4D声词:唧咪喃咕咻嗄咿当咚嘟吁
01001110=4E连词:又且连予与和及同跟并但
01001111=4F介词:因以替代给乘趁赶沿顺照

01010    根源+环境
01010000=50本源:宇宙时空元本末性命智慧
01010001=51性源:正负阴阳男女雌雄公母牡
01010010=52视源:点线面体横直斜曲形样状
01010011=53感源:能力电磁热声气味物质朕
01010100=54知源:公私禀赋体用因果事业席
01010101=55人源:汉满蒙回藏蛮狄羌蕃鞑靼
01010110=56宗源:中美英德日法夏商周秦汉
01010111=57居源:亚美欧澳非郡府州省市县

01011    现象+环境
01011000=58本象:景天昊穹霄日月星林地山
01011001=59表象:痕斑绣纹锈玟玷瑕瑜辙迹
01011010=5A形象:角方矩格棱圆锥椭珠球蛋
01011011=5B感象:质数量音响劲势功籁气氛
01011100=5C质象:气汽液浆汁泡沈胶韧韧糊
01011101=5D固象:窟窿坎洼穴堀厂圈眼口孔
01011110=5E液象:潮汐波浪涛澜澐漩涡涟漪
01011111=5F气象:云雯霭雾霾雨霖霪雪雹雷

0        客观
01       抽象   象、数、性、征、关系、意义、条件、利害
011      应用   名称用,系现实环境之对象。
01100    讯息+介面
01100000=60资讯:言语资料文字概念符号模
01100001=61识讯:姓名字号甫性别籍贯住址
01100010=62视讯:招牌旗帜麾帘纛榜徽碑铭
01100011=63事讯:价值谊恩仇惠利害毒寿功
01100100=64文式:句段节章题篇档辑场景曲
01100101=65文体:序箴跋诗词训诂韵谚谜彖
01100110=66文件:帖牒稿信函笺牋牍简柬札
01100111=67文据:旨诏证照征凭状例单据执

01101    利害+情绪
01101000=68意利:吉祥瑞庆祺祯禧泰幸福禔
01101001=69公利:道德廉耻勤俭诚信仁恕爱
01101010=6A性利:艺术文学图画雕塑庭园音
01101011=6B财利:金银财宝贝珠款钱钞帑币
01101100=6C意害:苦灾厄旱涝潦祸殃燹殍馑
01101101=6D病害:疵恙暍疱疥痨瘀痢瘴症癌
01101110=6E体害:眇瞍瞽瞎瞶盲聋聩哑残癈
01101111=6F命害:鳏寡孀孤独茕罪辜疯痴癖

01110    事理+方法
01110000=70法务:宪法律制刑规则秩序契标
01110001=71公务:品邦国采族家氏门派社党
01110010=72组务:府院部司署局科课组校所
01110011=73职务:特简荐委使揆长吏僚员帅
01110100=74事务:政军经济武戎战税赋稼穑
01110101=75业务:士农工商教警军兵医渔牧
01110110=76界务:郊野限圻际徼范畴邻疆域
01110111=77源务:朝廷宫闱殿阙泮黉宬邸寺

01111    关系+态度
01111000=78本系:父母爸庭考妈慈妣娘婆伯
01111001=79姻系:岳夫妻妾姬妗荆配偶伉俪
01111010=7A人系:亲戚嫡胞胄嗣裔表眷干朋
01111011=7B宗系:仙佛神只妖怪魔鬼僧喇嘛
01111100=7C通称:丈翁伧叟妪媪汉郎佬妇娃
01111101=7D行称:圣贤侠彦豪杰傧客盗匪宄
01111110=7E人称:绅曹官庶民姝侨板倌仆役
01111111=7F源称:皇帝王君后嫔妃太子驸马

1        主观   事物的状态,人类的情绪、心志、意念、举动、行为。
10       认识   刺激、分辨、状态、感受、程度、印象、情绪。
100      感知   形容词,因觉而知,由接收刺滶到产生印象。
10000    视觉+能量变化。
10000000=80光状:明朗亮昭暗晦暝暧曦曈朏
10000001=81色状:白素灰黑玄乌黛卢红赤丹
10000010=82明状:皓皎晖晰荦霁显蒙龙瞒眛
10000011=83性状:纯粹杂浓稠黏巴粘淡干燥
10000100=84形状:平直纵横斜竖立正歪偏隆
10000101=85体状:厚薄狭仄高低粗细矮扁大
10000110=86势状:崇嵚巍峨嶒嵩岩岧嵌峥崎
10000111=87态状:澄湛清洁净澈浑浊污洪沛

10001    感觉+其他感觉
10001000=88食觉:香馨芬芳臭臊腥膻馡郁焦
10001001=89触觉:细嫩滑粗涩暖熅温凉热燠
10001010=8A质觉:皮致稹密严精缜疏弛酥硬
10001011=8B体觉:痒楚僵肿嘶哑瘖噎骾饿渴
10001100=8D意觉:恍惚疲困倦累惫眩劳昏晕
10001101=89听觉:响嘈谧悄阒希静默岑寂幽
10001110=8E知觉:仃单孑萧寥拮据稔乏安稳
10001111=8F思觉:惘困惑漠湎迷僻秘密怪诧

10010    心绪+程度
10010000=90意感:谧恬逸享悠闲娴烦闷忐忑
10010001=91源感:缅愐怀念向记挂惦冀盼待
10010010=92人感:宠爱好恋惯幸嗜耽贪婪馋
10010011=93物感:节俭省撙吝啬惜悭苛慷慨
10010100=94良感:喜乐愉悦怡欢欣慆爽惬舒
10010101=95触感:惆怅怃惝颓怏沮窘尬尴糗
10010110=96害感:忧愁悱惴悁悒忡郁怛戚惙
10010111=97恶感:嫌藐厌恶憎懑忮罣愠妒忌

10011    印象+背景
10011000=98意性:愎佶倔顽訑拗怯憨懦苟木
10011001=99质性:才隽智慧睿聪敏伶俐黠庸
10011010=9A体性:帅俊倩艳秀壮丑陋肥胖瘦
10011011=9B行性:潇洒倜傥庄严肃穆逍遥雍
10011100=9C良性:娴驯婉乖淳澹朴朴谦贤善
10011101=9D表性:邋遢猥亵儇佻骚酷妖冶娇
10011110=9E感性:惊惧骇噤嗫嚅愕惮恐悚怖
10011111=9F恶性:蛮虐凶戾狠暴凶刁奸狡猾

1        主观   事物的状态,人类的情绪、心志、意念、举动、行为。
10       认识   刺激、分辨、状态、感受、程度、印象、情绪。
101      状态   所辨知的各种变化的状态。
10100    动态+引力、作用力、反作用力等
10100000=A0转动:转回旋回斡呙棊萦翻滚缘
10100001=A1位动:运舣晃袅荡荡摆宕腾舞娑
10100010=A2形动:长涨伸延缩舒展胀张膨脝
10100011=A3势动:闪喷射铤爆炸迸崩怦决溃
10100100=A4源动:下降落陨坠堕掉上升升冒
10100101=A5力动:震振碰砸撞捣舂碾轧辗輘
10100110=A6表动:飞翔翩翥翾颉颃飘翻刮扬
10100111=A7水动:流淌汩溢泛滥沔漫淋泻泄

10101    化态+性质
10101000=A8宙态:古昔曩早先初常晚迟新陈
10101001=A9宇态:旷阔敞博袁魁京乔穹广尧
10101010=AA能态:映照耀晒炫熔铄炀沸滚焚
10101011=AB势态:强勍弱倏疾威猛狂勃厉剧
10101100=AC容态:满盈弥光空枵罄充深覃湛
10101101=AD事态:繁纷纭缛丛简紊乱糅蓬松
10101110=AE生态:菁茂茁葱蔚荒芜萎孳蓼荣
10101111=AF命态:妊娠生产诞殖种孵娩孕滋

10110    界态+性质、关系
10110000=B0通界:开辟阖关闭阻封堵杜遏淤
10110001=B1连界:连接衔袭嗣联结亘继续赓
10110010=B2触界:支承触及搭挨贴偎傍靠倚
10110011=B3形界:互介跨翕并并比毗峙邻临
10110100=B4体界:纠结交叉纽缔综绵絮缠绕
10110101=B5状界:浸渍浞泡沾涵淹溺浴渲染
10110110=B6向界:垫衬枕牚堆卡叠托壁亭屹
10110111=B7量界:和凑兼合分摊磊多复少几

10111    识态+价值
10111000=B8时识:起始启创肇终止既竟竣艮
10111001=B9事识:经历虔妥顺怕惕畏凛懔崇
10111010=BA形识:现曝露呈暴敞彰赤袒粲裸
10111011=BB状识:破碎齑敝解断裂绽消销泮
10111100=BC意识:好优良佳嘉坏劣莠歹窳对
10111101=BD力识:动静开关停顿住休息止却
10111110=BE判识:胜成捷负败北足绰够敷得
10111111=BF利识:资珍贵靖贫穷窭富裕饶卑

1        主观   事物的状态,人类的情绪、心志、意念、举动、行为。
11       反应   能力、意念、目标、动作、功效、判断。
110      能力   经由肢体及生理功能所形成的行为。
11000    官能+感官
11000000=C0食况:吃食啖馔茹斋饮喝啜饲喂
11000001=C1观况:看视瞧瞻望观眺瞩盯瞅瞄
11000010=C2声况:读咏诵念歌唱讴呼叫嚷唤
11000011=C3嘴况:嗝呃呛吹哮喘嗤嘘歔含叼
11000100=C4意理:梦魇旅游逛娱戏玩耍撩弄
11000101=C5情理:瞪瞠睁睚瞋瞑眯乜瞟眨抿
11000110=C6生理:睡眠寝盹寐苏醒觉歇憩瞌
11000111=C7人理:娶嫁婚逑配赘醮祭祀禓禋

11001    体能+肢体
11001000=C8动处:行走辵爬扒攀匍匐陟登渡
11001001=C9动止:站立伫企厕坐跏趺跪仰翘
11001010=CA动体:亲搂拥抱吻挣扎拦挡妨碍
11001011=CB动式:踱步躂逗遛局蹒跚踽迤逦
11001100=CC动形:跹跄蹒蹿偃仆跤撑摔扑亍
11001101=CD动状:踏踩蹀踹蹈跺践跆蹍履蹬
11001110=CE动向:进赴趋晋入出退往离返去
11001111=CF动类:骎驰骋骛颿驱騑騤骈骠猋

11010    功能+效应(体=手,用=物、功)
11010000=D0手动:抬拱招扬挥昜甩摆摇搧指
11010001=D1手触:搭扪摸抚按捺托撮端搓揉
11010010=D2手控:拿把扼握持抛撇扔丢投掷
11010011=D3手刃:斩劈砍剖切割剌锉削刮铲
11010100=D4易形:摊摺卷卷折扳拗撅捆捆绑
11010101=D5易状:采摘撷束缚捞抄揣填塞堙
11010110=D6易向:捡拾搬移挪举擎提曳拎推
11010111=D7易表:揩拭擦抹拂掸扫抆涂敷搽

11011    智能+目的(用心)
11011000=D8观智:勘看视阅览伺浏聆听闻嗅
11011001=D9辨智:计辨认验证证鉴据鉴估算
11011010=DA思智:想思忆遗忘忖省猜揣测臆
11011011=DB知智:懂憬悟明晓会知识宜可符
11011100=DC述智:着谱撰述抄写记录签誊缮
11011101=DD谋智:图谋企拟营扩拓祈祷祝搜
11011110=DE判智:挑选遴甄拣比较揆媲校斟
11011111=DF控智:待熬捱禁忍耐憋努律歛专

1        主观   事物的状态,人类的情绪、心志、意念、举动、行为。
11       反应   能力、意念、目标、动作、功效、判断。
111      经验   经验则需要学习,包括做事待人等行为。
11100    生活+对象
11100000=E0炊事:烹饪炊煮熬炖烩煲蒸焖馏
11100001=E1住事:穿披褪捋戴顶饰妆扮剃沐
11100010=E2居事:修葺剪搞弄补衲钩裁编缝
11100011=E3行事:寓居宿栖羁留泊屯驻航划
11100100=E4农事:佃垦播种植培育犁耕耔耘
11100101=E5工事:建筑砌垸砺锻炼铸冶淬镀
11100110=E6育事:教育陶毓训导诲迪学习摹
11100111=E7物事:划刊辑编印纂剟设铺铺装

11101    沟通+人
11101000=E8意通:说道曰云讲叙谓述言语话
11101001=E9理通:问讯谘询商议咨讨答应许
11101010=EA态通:请谢赞许褒奖赞嘉颂贺捧
11101011=EB利通:叩拜跪揖鞠躬觌觐谒诣宴
11101100=EC情通:嘱咐叮咛谅宥恕饶劝谏励
11101101=ED感通:笑莞哂嬉闹咒咆哮哭泣啼
11101110=EE气通:讧谴责讦訾骂詈斥叱讥讽
11101111=EF恶通:讹搪僭佯夸诌吹詅诩唬骗

11110    处理+事物(对象=*)
11110000=F0处意:殉誓决拼操克克恃逞贯彻
11110001=F1处行:戒舍弃罢消减免删禁戢革
11110010=F2处位:反对背叛仇攻攘防守抵抗
11110011=F3处事:传送授受办执掌托设施务
11110100=F4处物:领取收纳供给付寄汇输递
11110101=F5处财:贸兑换买购赎卖售货贩花
11110110=F6处力:扰侵犯闯搏阋捣蹂躏战斗
11110111=F7处恶:偷窃盗扒夺抢劫掠拐篡括

11111    待人+人,团体
11111000=F8用人:使驾驭统率御揽宰治管辖
11111001=F9知人:宣布谕喻示让俾命令吩咐
11111010=FA处人:聘雇征募佣擢荐役掖代替
11111011=FB命人:监督排抑箝挟控驯慑胁镇
11111100=FC事人:恭尊敬顺从服伏遵循皈依
11111101=FD利人:保护袒戍卫廕庇佑顾辅佐
11111110=FE害人:打惩罚囚拘锢坑拷棰鞭笞
11111111=FF恶人:剿剿诛歼夷毁灭泯宰杀殊

第七节 汉字部首基因

一、常识分类

先贤对常识概分两类,即以静态为“体”,动态为“用”。同时在概念组合中,最常 知、最常用者被整理成为“部首”。于是,一种“系统关系”自然形成,即“体之可动者 ”,适为造字“应用”的基本法则。

以此法则,细查部首,再与概念分类比较,果然各“部首”完全符合静态定义。至于 组合字则依其特性,若系“动态”,则一律为“用”。

举例而言:凡“手部”之字,几乎都是“手动”之“应用义”(西方文法谓之“动词 ”);凡“心部”之字,则代表“心情”之“感觉义”(西方文中谓之形容词、副词), 这些正是常识分类的“体用”明证。

既然如此,汉字“文法”已在文字结构中具备,何以还要向“西方取经”,搞些个不 伦不类的“殖民式汉文法”?

此中可研究之工作甚多,皆为发扬我汉文化之无价宝藏。其中细节无须一一列举(可 见《汉字基因字典》),但愿国人奋发图强,自行研究之。

编按:《2017 漢字基因字典》已上线

   https://github.com/ChuaTony/Chinese-character-gene-dictionary

二、部首分类

根据概念分类表,部首多属静态四知,兹假定如下:

    1,本存之部首有:
本体--日月金水土气玉石山
植物--木禾黍麻米麦瓜竹艹
肢体--目舌身页肉血羽皮毛爪骨鼻角心手足髟耳尸齿
动物--鱼龟鼠鸟黾鹿隹虍贝豸豕羊虫犬马牛

    2,人造者多为“几何形”,有特定机能。
食衣--臼缶豆皿酉衣巾革韦糸
住行--门龠瓦车舟几广宀冂邑阜
起居--鼎鼓鬲爻隶斤斗寸
工作--耒聿网殳矢矛匕弓刀

    3,规范者多供辨知,刺激或参数。
定义--歹方齐高面首长工⼳囗士夊小大里疋
根源--力光色音彡香火
现象--谷黄雨青赤白夕鬼风穴疒黑巛

    4,应用者多系感应观念。
讯息--言采老辛甘爿片玄冫曰文无龙
事理--彳斗非辵走行见用比支攴八飞止艮
关系--生父子女氏干欠隶臣自至入立又

三、常识定义

以下略举数例,以供参考:

 第八节 汉字与八卦的关系

一、易理

《易经》是一本奇书,对中华文化影响之深,可以说无与伦比。《易经》之根本道理 称为“易理”,是以二分法、分层界定各种观念的原则。这种分类法最宜于简化观念,但 在电脑未发现前,认识其真正价值的人不多。

汉字与八卦同源于“易理”,前者是中国人思维的载具,后者则流行于民间,成为一 种“术数”。有一本研究丹汞的《易经参同契》,在十三世纪时,经阿拉伯人传至欧洲, 被一些宗教的修士视若瑰宝,导致后来“化学”的振兴。

在智慧未兴之前,人类没有“判断根据”,因而非常“迷信权威”。所谓“迷信”, 是指未经自己亲身体验证明之事物,只因某种原因,便深信不疑者。当有人不懂《易经》 ,认为是种迷信,就有人“迷信易经是迷信”!

本文并非要证明什么,信与不信原本由心,得失寸心知,绝不勉强。在此只为解说古 人思维周密,数千年前定义八卦,设以象征,隐约中有大义焉。迨至本人整理概念基因, 无意中与八卦比较,两者竟然不谋而合,是巧合欤?是卓见乎?

二、两仪四象

太极分两仪,既分,得阴静、本体、客观之0,以及阳动、末用、主观之1。两者非 此即彼,但又互为表里,循环生息。

两仪再分四象,客观为观者所及,及于静态本体,有具象之“体、形、质、量、色、 位、能、价”等因子,可供辨识、应用。更有抽象之“象、数、性、征、关系、意义、条 件、利害”等以供认知。

主观为观者所受,受于动态认识,亦为事物之用,如“刺激、分辨、状态、感受、程 度、印象、情绪、希冀”等;进而为反应,是认识之用如“能力、意念、目标、动作、功 效、判断”等。

四象分为八卦:坤、震、坎、兑、艮、离、巽、干,<易经说卦传>第十一章,述及 各卦象征,经整理后,下表左半系原定义,右半则为本人增修:

原定义             增订

-----------------------------

坤为地,阴阴阴,静,母亲,腹  顺静,象根本、众多、万物等。
震为雷,阴阴阳,动,长子,足  随动,象生命、生存、生活等。
坎为水,阴阳阴,陷,中男,耳  中陷,象观念、认知、现象等。
兑为泽,阴阳阳,悦,少女,口  用悦,象事物、沟通、关系等。
艮为山,阳阴阴,止,少男,手  感止,象感官、感知、感识等。
离为火,阳阴阳,丽,中女,目  态丽,象变化、状况、现象等。
巽为风,阳阳阴,入,长女,股  能入,象功能、体能、智能等。
干为天,阳阳阳,健,父亲,首  行健,象经验、原则、方法等。

三、八卦与八知

再以概念分类之“八知”一比较(0为阴,1为阳),可见两者不谋而合:

 第九节 汉字基因的研究方法

一、怀疑求证

本人素来视查字典为畏途,不仅字首、笔画不明,且查到的“字”,竟然都只有“词 句”的解释!为什么?难道“汉字”没有“字义”?

兹以《辞海》为例,查一“好”字,得:
【好】 ㄏㄠˇ  Haoˇ
动:有交情、彼此情投意知;例:友好。
动:完毕成功;例:做好。
形:优美;例:好花。
形:善良;例:好人。
副:很;例:好久。
副:容易;例:这种事情好办。
副:可以;例:好的。
   ㄏㄠˋ  Hawˋ
动:仁爱而不嗜杀;例:好生之德,治于民心。

好像说得很清楚了,为什么一个字有这么多“意义”呢?其中:“有交情;完毕成功 ;优美;善良;很;容易;可以”之间,又有什么关系呢?如果没有,那要花多少脑汁去 记忆?去搜寻?如果有,既然是“字典”,为什么不说明“好”字呢?

我百思不得其解,《辞海》、《辞源》名为辞典,但是却一直被当作字典用。而其后 的“字典”,也无不以辞典为蓝本,一律“以词释字”,而浑忘了文字的“本义”。

《辞源》(大陆版)发刊文中,说明:“…吸收西方辞书编辑方式所编纂的…编辑工 程始于清光绪三十四年,…是中国印行最早、规模最大的现代化辞书…”。

原来如此,国家弱了,连文字的学习,也要洋化!自清末至今,枪炮重于文化,训诂 之学癈了,也就难怪知识分子向往英美,大怨汉字难学!于是各种理论出笼,无非是要淘 汰汉字,改用拼音文!

汉字真难学吗?“好”真是“有交情、彼此情投意知;完毕成功;优美;善良;很; 容易;可以”这一大堆似是而非的概念吗?

我当然不服气,求人不如求己,下定决心,我只好独自探索。

原以为《说文》是唯一的道路,但不要多久,我发现《康熙字典》中、蕴含了丰富的 字源及完整的史料。我突然想通了,从古到今,文字只是供人“使用”的,又有谁去关心 “为什么会这样用”呢?谁想知道,谁就得自己动手!

当然,要在“故纸堆中下功夫”,是必须先戴手套面具,以免被尘灰所遮没。《康熙
字典》的编汇是几百年前的事了,那时的书籍有限,人能接触到的不多,所以“精读死背
”是唯一有效的法门。但是时代在进步,知识爆炸,今天文字只是一种“工具”,“精读
死背”所费的时间太多,“方便法门”若不改变,文字就失去了应有的价值。

二、定义

以“好”字为例,在《康熙字典》记载中,有十七种诠释,其中《说文》最透彻:“ 爱而不释也,女子之性柔而滞有所好则爱而不释,故于文,女子为好”。

许慎既有此说,以人性而论,人生“有女有子”岂不大“好”?所以,本人以为:在 人的立场,有女有子符合利益;符合自己利益的概念就是“好”,引用为“正”。

用这种解释来验证《辞海》的词例:
例-友好:友情符合利益。
例-做好:做到符合利益。
例-好花:符合利益的花。
例-好人:符合利益的人。
例-好久:正久。
例-这种事情好办:办这种事情符合利益准。
例-好的:符合利益的。
例-好生之德:符合生命之德。

用一种统一的解释方法,放之四海皆准。于是本人根据这个原则,将所有的汉字检查 一遍,写了一本《汉字基因字典》。

编按:《2017 漢字基因字典》已上线

   https://github.com/ChuaTony/Chinese-character-gene-dictionary

三、提炼

假定前述理论为真,再假定每个汉字都能用简短的文字加以定义。则根据这些定义, 可以提炼出最精简的“汉字定义因子”,是称“汉字基因”。

“在人的立场,有女有子为符合判断之正标准”。这句话中,有几个不同的因子,经过不断地整理、分析、归纳,得到以下的结论:

在  =抽象;规范;语法;介面词。
人  =具象;本存;本体;命体词。
的  =抽象;规范;语法;从属词。
立场 =抽象;规范;本源;知源词。
有  =抽象;规范;语法;述词。
女、子=抽象;应用;关系;本系。
为  =抽象;规范;语法;述词。
符合 =反应;能力;智能;知智。
判断 =反应;能力;智能;判智。
之  =抽象;规范;语法;从属词。
正  =抽象;规范;本源;性源词。
标准 =抽象;规范;本源;知源词。

识者当可看出,由前文各基因的条列中,理解窍门尽在其中矣!

第十节 汉字基因与理解之科学根据

一、科学立场

所谓“科学”,乃事物“分科之学术”。因自然界事物繁杂,如不分门别类,一一追 究其所以然,人类将无从认知各种事物之真象,更无从加以利用。

分科处理有两种方法,一为“归纳”,一为“分析”。

归纳是在一个原则下,根据事物的特性、同异的多少,有系统地纳入某类。诸如物种 之“界门纲目科属种”,依各类物种的特性,归属容纳,令人一目瞭然。

分析则是探索事物的“根本”,并一一证明之。在抽象之过程上,根本是称“规律” ;而在具体结构上,则为性质之“基因”。

当今能量界的一些“规律”(如古典力学或量子力学的物理定律)已获公认;物质的 “基因”(化学元素周期表)历经考验而成立;生命“基因”(DNA)也正逐步展开中 ;唯有人类思维、意识、理解则尚属“唯心”阶段,人言人殊。

在科学立场来看,任何事物的作用,都是其“基因”经固定的“规律”所形成者。对 汉字而言,找寻其基因,验证其规律,就是科学。换句话说,只要汉字有“基因与规律” ,汉字就符合科学原理。

同时,汉字既为思维的载具,只要能证明汉字合乎科学,就可以根据科学方法,引证 思维、意识、理解的客观正确性。

二、介面

假定有一理想的“刚体”系统,如有能量作用其上,在一定的时间中,该刚体任何部
位上之能量大小均等。再当能量由一个刚体传导至另一刚体时,能量必须先经过一“介于
两者间之面”,是称“介面”(任何系统之间,皆为介面)。此介面可假设为一个刚体或 无数层刚体所组成,其层次愈少,效率愈高。

由于宇宙中并无真正的“刚体”,以致能量作用必有损耗。尤其是概念的形成与沟通 ,涉及许多“非刚体”之介面,诸如刺激大小、感官灵敏性、记忆力强弱、环境影响、主 观认知与意念等,在在形成干扰,以致理解效率极低。

仅以甲乙二人对话为例,设若甲之表达能力为80%(基于各种因素,100%是绝 对没有可能的),而乙之理解力亦为80%(一般人只得一半,40%),则信息的传播 效率只得64%(若甲乙皆为40%,结果是16%)。

人生最大的问题,是一己之“灵智”被禁锢在“肉体”中,必须与他人沟通,以扩大 经验范围。然而,基于每个人对语言、文字的介面认识不清,在层层损耗下,人与人之间 ,经常沟通不良,偏偏又固执成见,以致误会频生。

人类对外在刺激的基本介面是“感官”,原则上,各人之感官功能相若(所差者灵敏
度而已),外在刺激的差异也可以忽略。但是,在刺激形成概念之间,介面层层(经过感
官、神经原、大脑皮层,再经体内激素、行为反馈、利害认知等),各人之概念不仅相去 甚大,而且变化不停,永无止境。

因此,任何人要发挥其最大的“能量”,必须先将其各层介面彻底理顺,务必要“概 念清楚”,层次分明,并且能统一在某客观的体系下。否则,人连自己的思绪都不清楚, 对他人的表达无法理解,充其量只是一尊毫无效率、自以为是的肉结构而已。

三、机器理解

理解者,“以理解之”,“理”为一种方法,“解”为其过程,“以…之”则可谓之 “介面”(“理”=玉+里:玉之量度,条纹。“解”=角+刀牛:刀剖牛角,先明其理 ,进而分之。“以…之”皆为语词,指其对象)。

假设甲乙二人沟通,所使用者为文字,理解即指“二人对该文字”之认知作用。然而 ,甲对文字形成介面,乙亦然,如两人之“介面”不尽相同,则必须以更接近之“介面” 一一填补。当介面愈多,沟通损耗愈大,甲乙两人之“相互理解”就更加困难。

假设前述之“乙”非人而是“电脑”,二进位为其根本之介面,故若能以二进位定义 概念,电脑必可“理解”(利用汇流排直接解码,进入体用之机器模组)。

事实上,中国的《易经》在数千年前就已使用二进位分类,且汉字受影响甚大(第二 节之概念分类表即依易理分类而得。据传,莱布尼兹发现二进位,亦得自易经灵感),故 电脑理解汉字,是轻而易举之事。

准此,将概念的分类基因与电脑硬体结合(相当于刺激讯号与大脑神经原直接交联) ,即令用4Mz最廉价的控制中枢,其反应速度也可达到数十万个概念/秒(绝不能用软 体,因阿猫阿狗都想插上一脚,是则天下大乱矣)!

作者研究汉字基因垂三十年,深知此中利害因果,汉字是中华文化中不可或缺的一环 ,又是资讯时代的兴衰关键。不将之发扬光大,“拥技自珍”固“怀壁其罪”,而将人类 主权旁移,令电脑理解“人事”,更将为千夫所指也!

不论如何,汉字是人类思维之精华,用之于正举世蒙利,若以之循私,则后患无穷。 本人适逢其会,不敢擅专,特公之于众。

原文地址:http://bbs.aixxz.com/index.php?thread-5.htm

官网:www.xiaoxinzi.com

论坛bbs.aixxz.com

时间: 2024-09-19 06:19:24

汉字基因十节课(中文人工智能理解核心基础教程)的相关文章

第十节 抽象方法和抽象类 [10]_php基础

面向对象程序通过类的分层结构构建起来. 在单重继承语言如PHP中, 类的继承是树状的. 一个根类有一个或更多的子类,再从每个子类继承出一个或更多下一级子类. 当然,可能存在多个根类,用来实现不同的功能. 在一个良好设计的体系中,每个根类都应该有一个有用的接口, 可以被应用代码所使用. 如果我们的应用代码被设计成与根类一起工作,那么它也可以和任何一个从根类继承出来的子类合作. 抽象方法是就像子类中一般的方法的占位符(占个地方但不起作用),它与一般方法不同-没有任何代码. 如果类中存在一个或更多抽象

《Photoshop+Lightroom数码摄影后期处理经典教程》—第1章1.1节课前准备

第1课 使用前的准备工作 Photoshop+Lightroom数码摄影后期处理经典教程 本课概述 在这节课中,读者将会了解到利用Photoshop和Lightroom编辑照片的所有预备步骤.首先,读者将了解Lightroom目录和自己准备导入的照片之间的关系,以及将Lightroom照片储存在什么地方.然后,读者将了解到如何将照片一步步导入到Lightroom的目录中.最后将涉及Lightroom和Photoshop处理照片的准备工作,以此为后续更好地使用软件做准备.本课包含以下内容: 理解L

给大一新生上C语言,第一节课大家有什么建议呢?

问题描述 这学期接了学校里的C语言课程,大一的新生第一节课,我希望能让让这帮孩子们能够对C产生较大的学习兴趣,从而用兴趣驱使学习大家有什么好的建议么?我是一个吹水型的老师~ 解决方案 解决方案二:应该从basic开始教,用初中生教材.解决方案三:不好好学小心不及格解决方案四:你先写个小游戏然后告诉他们这是用C写的解决方案五:有兴趣编程的哪有兴趣来上课.来上课的那有兴趣编程.解决方案六:引用4楼devmiao的回复: 有兴趣编程的哪有兴趣来上课.来上课的那有兴趣编程. 不知道你在说什么解决方案七:

长沙教育培训行业乱象:2000元一节课不算贵

本报记者阮占江 本报实习生刘文楠 证照不全违规办学却以"名校名师"噱头高额收费 培训收费居高不下,艺术类的培训一节课时费2000元,半年学费近20万元:虽然证照不全依然违规办学,还赫然以"名校名师"为噱头虚假宣传,到处招揽生源:带队老师公然收受高额回扣:一些培训机构动不动就卷款跑路--近日,有市民向<法制日报>记者投诉称,湖南长沙的社会教育培训市场可谓乱象丛生. 记者调查后发现,虽然长沙各监管部门曾多次联合进行过清查与整治,但由于其中存在多头审批,审批标

new-link可制作课程表,想在左边增加第几节课的数字,自己改了代码不对了

问题描述 link可制作课程表,想在左边增加第几节课的数字,自己改了代码不对了 using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Text.RegularExpressions; using System.Threading.Tasks; namespace ConsoleApplication1 { class Program { static v

link生成随机课程表,要求每天6节课

问题描述 link生成随机课程表,要求每天6节课 link生成随机课程表,要求每天6节课,每天都有语文数学英语,总共各7节,体育课2节,美术课1节,音乐课1节,劳动课1节,社会课1节,自然课1节,思想品德课1节,剩下都是自修课. 解决方案 using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Text.RegularExpressions;using Syste

多线程-VC++孙鑫第十五课聊天室程序,如何有UDP改成TCP通信

问题描述 VC++孙鑫第十五课聊天室程序,如何有UDP改成TCP通信 看了孙鑫的第十五课:<多线程和聊天室程序的创建>,对其中的聊天室UDP程序中不断接收数据部分比较感兴趣,想把它改成TCP的版本,但是出现了不少问题不知道该怎么解决. 改动部分如下: 1.在InitSocket()中添加了listen和accept函数 2.由于TCP中连上之后发送数据需要使用accept获得的套接字,所以在OnInitDialog()中定义pRecvParam->sock=m_client; pRecv

Asp.Net Web API 2第十四课——Content Negotiation(内容协商)

原文:Asp.Net Web API 2第十四课--Content Negotiation(内容协商) 前言 阅读本文之前,您也可以到Asp.Net Web API 2 系列导航进行查看 http://www.cnblogs.com/aehyok/p/3446289.html 本文描述ASP.NET Web API如何实现内容协商. HTTP规范(RFC 2616)将内容协商定义为"在有多个表现可用时,为一个给定的响应选择最佳表现的过程".在HTTP中内容协商的主要机制是以下请求报头:

Asp.Net Web API 2第十二课——Media Formatters媒体格式化器

原文:Asp.Net Web API 2第十二课--Media Formatters媒体格式化器 前言 阅读本文之前,您也可以到Asp.Net Web API 2 系列导航进行查看 http://www.cnblogs.com/aehyok/p/3446289.html 本教程演示如何在ASP.NET Web API中支持额外的媒体格式. Internet Media Types--Internet的媒体类型 媒体类型,也叫做MIME类型,标识了一片数据的格式.在HTTP中,媒体类型描述了消息体