第740章 文字、编码、碱基序列(1 / 2)

一拳歼星 剑走偏锋 1135 字 2个月前

一个人的生命是短暂的,但一个生命种群却可以永久的延续下去。

在一种生物的基因片段中记录信息,这是一件让人难以想象的事情。

“这些碱基序列,应该是人为写下的,应该没有错。”方源用异能观察着玻璃球里的陨石微生物,心中有波涛在翻涌。

“碱基不是一串串的分子吗?你怎么确定是人为写的,不是自然形成的。”牛大志转动脑瓜,开始认真的思索这个严肃的问题。

“无知真的限制了你的想象力。”伊芙摇头叹气,一副恨铁不成钢的表情。

“我在认真思考问题,你能不影响我思考吗?”牛大志拿牛眼瞪她。

“我问你,一共有多少个汉字?”伊芙话锋一转,开始转入正题。

牛大志摇头,一脸理所当然的回道:“谁没事会记这玩意。”

“我就会,我的汉语老师以前教过,你从小母语就是汉语,竟然不知道。”伊芙瞪眼露出气恼表情。

“正常人都不可能知道。”牛大志跟她杠上了。

“幼薇快告诉他。”伊芙开始拉韩幼薇帮忙。

“《辞海》收录有个汉字,《康熙字典》收录有个汉字,我们通常用的《新华字典》收录有8500个汉字。”韩幼薇报出了一连串的数据。

伊芙拿眼瞪牛大志,一副很得意的样子。

牛大志一挥手,直接评价道:“她不是正常人,不算。”

过了一会儿,他又想起刚才说的正题,又绕回来:“不对啊。你别岔开话题,我原本想说的是怎么知道基因序列里的碱基是人为排列的?也许是自然形成的呢。”

伊芙一脸鄙视把脸扭到一边去,哼道:“幼薇,你来告诉他,我不想和这家伙说话。”

“你自己说呀,干嘛老是让我说。”韩幼薇咕哝一句。

伊芙在桌子下面,用手拽韩幼薇的手指,小声的催促道:“你说,你说,你快说。”

韩幼薇无奈的摇摇头,组织一下语言,开始解释道:“好吧。按照我的理解,如果用DNA序列当做编码记录信息,那么应该是一种四进制编码。

“而我们的计算机用的是二进制编码,单从数学上来说,四进制编码可以记录的信息是二进制的两倍。

“二进制需要四位数才能记录的信息,四进制只需要两位数就能完成。

“两倍的差距,其实不算大,所以如果用生物的基因序列记录信息,那么所用的编码方式,应该不会有太大的区别。

“陨石文明,我们暂时将这个在微生物基因序列中记录信息的文明叫做陨石文明好了。

“陨石文明用的肯定不是汉字,但无论用的是什么文字,表达情感、思想的作用是不会变的。

“也就是说,陨石文明把他们的语言,用四进制编码写在了微生物的基因序列里,那么我们可以通过我们的语言特征,对陨石文明的文字编码做一些推测。

“大家都懂电脑,应该知道,一个汉字占用两个字节。而一个字节,换成二进制编码,其实是8位数。

“也就是说,在我们的计算机编码里面,一个汉字需要16位二进制数字才能表示。

“我们的汉字有几万个,但其实1000个常用字就覆盖了92%的书面资料,剩下的几万个生僻字,是很少用到的。

“这些生僻字平时用不到,但是必须要在编码里给这些生僻字留位置。

“这就导致了这些代表生僻字的编码,很少会出现,常用的那1000个字,则会重复出现。

“我不知道陨石文明的文字是什么样的,但文字和语言,应该会有相似的特征。

“这些特征会影响到碱基编码的排列,当某些编码片