锟斤拷�⊠是怎样炼成的——中文显示“⼊”门指南【柴知道】

作者: 柴知道分类: 科学科普 发布时间: 2022-10-10 17:53:33 浏览:4538118 次

锟斤拷�⊠是怎样炼成的——中文显示“⼊”门指南【柴知道】

派对大魔王:
纠正一个错误: 私用区的位置画错了,应该画到绿色框所示的位置。 顺带一提,视频里出现的 “門唐”已经有简体版了。(可复制:??) 还有“兆頁”和“四个...

【回复】那个门唐还真不是所有设备能显示的,应该是中日韩表意文字的某个扩展。
【回复】回复 @小方盒LSCube : 我已经标注了,扩展H区。
诸事皆欢:
就这个问题,跟大家郑重建议,别给小孩名字里起生僻字。 我出生时我爸心血来潮,从新华字典万千汉字里挑出一个“䶮”字,给取名字里,成为我痛苦根源之一。这个字不单单是生僻字的问题,而且涉及到一字多码的问题,这个字的Unicode编码包含4DAE和E863两种,常见系统采用utf-8编码采用的都是4DAE,也就是“䶮”。因为深受其扰,前些时候突然看到了新国标GB 18030-2022《信息技术 中文编码字符集》,我把这个标准翻了一遍,然后发现国标里规定字符编码是E863,4DAE这个编码是未被定义的。E863正常显示下它是这样的“”。一般这种时候会有空白显示、或者其他的替代字符显示。然后就涉及到正常可显示的字符和身份证上实际的字符是不对应的问题,办理银行卡、实名注册等等各种环节都需要姓名编码逐字对应,我遇到的问题已经非常多了,涉及到这个字根本不可用,或者各银行系统使用的编码不一致,所以无法互相转账等很多问题。只能说文字编码是座屎山的话,我大概被塞到了最臭人的地方之一。

【回复】回复 @苍爵_ : 现在在读研,这个问题我之前本科和学校户籍科咨询过,一是现阶段改名,毕业后学位证上写的依旧是生源地档案里之前的姓名,改过以后,毕业时身份证上姓名和学位证、毕业证上的都不一致,当时上学户口迁到了学校集体户,毕业后有可能涉及到就业、档案迁移后还需要回学校辖区派出所开具证明等事情,所以考虑毕业后再改
【回复】所以为何不干脆改个同音字呢[思考]
霞鹜lxgw:
作为 5:21 和 9:00 出现的「霞鹜文楷」字体的作者,在此勘误一下:「霞鹜文楷」 并不仅仅包含 GB/T 2312-80,完整版已包含 CJK 基本区所有汉字 20992 个,另外也有一部分扩展 A~H 区汉字共 2 千多个;轻便版也有 1.5 万汉字,《通用规范汉字表》里收录的 8105 个字也已包含(如赵孟𫖯的「𫖯」字),也包括康熙部首。而 GB 版虽然只包含简体字,但也包含了通规表的全部汉字(GB 版确实不包含康熙部首)(另外,貌似您用的文楷字体是旧版。[暗中观察]) 当然,如果认为「霞鹜文楷」缺少【某个】字,欢迎通过 https://github.com/lxgw/LxgwWenKai/issues/33 反馈,记得反馈前将字体【更新到最新版本】。最新版本可在 https://github.com/lxgw/LxgwWenKai/releases/latest 或 http://lxgw.ys168.com下载,另外猫啃网也上架了这款字体。

【回复】lz的字体真的很好看!我的typora就是这个字体
【回复】啊啊啊居然发现了作者,霞鹜文楷真的超级全的(也超级好看)[给心心][给心心][给心心]
永恒的星星闪耀:
上联:蒸蒸日上烫烫烫 下联:年年有余屯屯屯 横批:锟斤拷锟斤拷 [嗑瓜子]

【回复】回复 @隔壁的文音 :烫烫烫,屯屯屯,锟斤拷都是常见的乱码[大笑]
Xeven1208:
以前贴吧经常有那种水楼,“能正确看到我打什么字的,手机都在5000元以上”。

【回复】比如能看见𰻝𰻝面的𰻝字的手机至少系统是安卓12或鸿蒙3.0的系统
【回复】回复 @函数返回值 :我超,我尽然显示出来了biang
【回复】然而只要主题商店上架了一个特别大字符集的字体,哪怕是红米都能变成五千元(
DTCcca:
我记得20年前,长辈跟我说,发给外国人的文档要转成PDF 因为他们的电脑打不开中文

【回复】回复 @心宿ニ :PDF文件就是为了解决不同设备显示结果不同,采用了完全不同于常规文档编辑软件的处理方式,使得接近于不可编辑,所以不可以编辑并不是PDF的缺陷,而是故意这么做的。
【回复】这只能解决看的问题。如果把pdf里的字复制再粘贴出来,依然是乱码
【回复】现在电脑是默认可以的。不过我们打印机依旧不识别中文。
我叫甄得秀:
手持两把锟斤拷,口中直呼烫烫烫[doge][doge]

【回复】Microsoft Visual C++ 在debug模式下会把内存全部初始化为0xCC,而中文「烫」字的编码恰好是0xCCCC。
【回复】脚踏千朵屯屯屯,笑看万物锘锘锘
未知的动力:
辛苦了...虽然我是一个普普通通的程序员,知道进制,比特,编码这些东西,但是锟斤拷是怎么来的,我还真没研究过, 感谢你给了我灵感,对~~ 灵感,我可以去写点奇奇怪怪的东西[妙啊][妙啊][妙啊][妙啊]

【回复】回复 @玛格努斯 :有没有可能……现在大学里也还是用vc++6.0[脱单doge]
【回复】可能是c你接触的不多?我十几年前上本科学c时还是用vc++ 6.0,日常锟斤拷烫烫烫,也看过很多人解释过
两元五角:
还有烫烫烫,为了方便调试,开发中的程序在非指令区(CPU不会执行的地方)填充十六进制0xcccc,以便在执行越界的时候触发越界中断(自陷指令),结果这玩意只能预防指令的执行越界,不能防止数据的读取越界,所以一旦程序员没有管理好自己飘逸的指针,就会把自陷指令当成中文字符输出,也就是烫烫烫[脱单doge]

【回复】我有个打信竞的同学逝图用c++指针把学校评测机里的答案全改成1……然后他的指针指向了系统文件[doge]
【回复】回复 @fesil :并不是,0xCC = int 3指令,在x86下就是产生异常指令,经常用在两个函数之间对齐用的。
东方明丶:
所以人类计算机编码发展到现在就是一座大屎山代码,各国大佬看着这座山,不约而同决定继续在这座山上拉屎 如同一个公司项目每年换一批,连续换了几百个后端一样

【回复】典型代表:windows 能让你在win11中看到各个前辈留下的足迹[脱单doge]
【回复】新三年旧三年缝缝补补又三年
【回复】回复 @ThreeManager785 :win12:重编译的全新的操作系统[嘉然2.0_啊笑死]
-杯傾川与溪-:
我几年前换手机迁机挪了上千本小说,新手机打开全变成乱码了[无语]现在换了两部手机了那上千本乱码小说还是拿它没办法,里面还有不少十几年前的古早文绝版文,找都找不回来

【回复】找一本从来没打开过的文档传到电脑上,然后尝试用各种编码格式打开试试,千万记得不要保存
【回复】回复 @D33274D7C6 :这类文件我往往会留一个压缩包,文件坏了误删了就重新解压[脱单doge]
筠和和和和和:
游戏昵称不能重复,但是游戏里f915和6d1b洛洛两个字长得一样[脱单doge] 然后昵称最长7个字 于是我们区有了一大群【洛洛洛洛洛洛洛】[脱单doge]

【回复】Il也差不多,小写的L和大写的i。IllllIIIllI[脱单doge]
【回复】回复 @八十带病偷塔 :多了可以看出来,他们两个不一样高[呜米_得意][呜米_得意]
【回复】看见这个我原本想算算最多有多少个组合,可惜点开回复框,愣了20s,忘了怎么算了[笑哭]。。。是不是C7/7,7*6*5*4*3*2*1=5040?实在想不起公式了
你最亲爱的LeeSin:
作为计算机专业的学生, 打开这个视频的时候以为只是简单的讲一下字符编码, 对柴知道这样的科普up没报什么能够讲得很通透的想法. 看完后不惊感叹能把字符编码原理历史都能将得如此专业且通俗易懂. 这一期真是太厉害, 果断三连了[小电视_赞]

【回复】确实,我也工作了很多年,碎片化的知道一些概念,有些细节还是很模糊,up的视频让我系统的知道了字符集的发展以及字符集和编码的关系,真的豁然开朗!好文!100个赞!
【回复】毕业工作的科班码农也有眼前一亮的感觉
【回复】UTF8刚学软件的时候真的是噩梦,经常在一台电脑能运行的代码放到别的电脑就不行了
梦丨无限神琪:
为了避免这种情况 所以使用PDF来回传文件 不过但凡发给我PDF表让我填的,我发回去必然还是PDF 来啊互相伤害啊~

【回复】回复 @仰望无垠星空 :PDF文件适合阅读但不适合编写,你试试修改一下pdf文档就知道有多头大了
【回复】回复 @仰望无垠星空 :填表得PDF转Excel才好填,所以填完转PDF发回,去让对方也不好复制内容[喜极而泣]
【回复】回复 @仰望无垠星空 :你可以理解为,文件转成pdf后相当于锁定了格式,不管用什么版本打开都是相同的内容,好处是避免版本冲突,坏处是不便再做编辑
猕猴桃是只猪:
阿拉伯字符也有一些奇异现象,它有些字符可以叠加成一个,当你叠加很多次的时候,当它显示的时候它会变成一个竖着很长的字符。几年前ios上的很多应用就因为这个现象出现过闪退bug,我们的app也遭殃了,比如有人恶意用这个机制更改昵称,或者发群聊消息,绘图缓冲区直接给干满了,然后oom

【回复】是不是一个字斜着或者螺旋向上或向下,可以一直干出屏幕,当初觉得好玩复制了一大堆
【回复】视频里面讲漏了一个,还有个东西叫“校对字符集”,也叫“校对规则”,COLLATION,在不同编码之间转换时,规则是不同的,比如字母a和e,在某些东欧小语种中应该合并为1个æ,不支持规则时就会处理错误。
【回复】这个跟字体的Opentype机制有关,要想在电子设备上正常显示阿拉伯语、藏语、缅甸语、印地语等Opentype功能是必不可少的,但通常不会过度叠加,你所说的状况应该是.mkmk脚本,这个脚本可以设置两个修饰符号的堆叠,如果叠太多也可能导致部分软件故障。
jxudvv1:
突然想到以前看到的段子:把代码里的分号(;)改成希腊问号(打不出来,但是和分号长得一样),然后程序员永远都找不出问题在哪里[doge]

【回复】编译器会提示;没有。熟练的程序员会删掉分号再打一遍,虽然不知道问题出在哪里但是能跑了
【回复】得改sql语句里面的,那个编辑的时候不报错,一运行就出问题
Lingdada翎达:
我记得以前玩gal时听说日文乱码是跟五十音对应的,还有个乱码对应表,所以如果按背五十音图那样给乱码背下来是不是就能看懂了[笑哭]

【回复】虽然但是,既然已经知道是日文乱码了,为什么不试一试神奇的locale emulator呢
【回复】虽然能编码转换器转回来日文,但翻译没了,[热]暂时不知道咋办
【回复】而且片假名全是单立人旁的[doge]
血痕胖胖:
突然想到以后考古的人员是如何猜测我国互联网历全变成”锟斤拷“的会不会以为我国互联网文明出了一场大乱子把所有的字都变成了锟斤拷的[笑哭]

【回复】数据是发展,又不是突然断代
【回复】信息库遭遇外形文明攻击,完整的内容被信息炸弹炸成锟斤拷碎片,以后的考古人员将所有锟斤拷按照正确顺序拼接起来,就能复原被摧毁的信息
【回复】这个是有纸质文件存档的
囬匚囬:
很喜欢这样的视频,虽然很多知识不懂但是视频做得很浅显,能够让人觉得懂了。还能在吹牛的时候利用这份知识扔出看似很专业的观点,语惊四座。[热]

【回复】其实网上大多知识类视频看完记不住的,以后遇到你只会记得有这么回事,但更详细的都不知道了
【回复】回复 @恰椒酱的花喵 :其实大多数时候这样也就足够了。
【回复】回复 @恰椒酱的花喵 :知道这个就差不多可以了,记得它然后再遇见问题时上网搜寻更专业的解决方法即可(非专业人士只需要知道有解决方法或者方向就行,不需要明确知道怎么解决)……然而记忆力不好的我连有这个信息都记不住[大哭]
Nabla_0:
康熙字典偏旁部首的那个位置, 要不试一下有什么样的组合? 我找到的第一个是比如说甘雨和⽢⾬ (还有马鹿, 文火, 赤鬼, 白皮, 石鬼面... 欢迎继续补充..?

【回复】回复 @往生堂78代堂主亲父 :瘦点的甘雨
【回复】回复 @往生堂78代堂主亲父 : 还是甘雨 只不过是康熙部首里的
【回复】甘雨后面是什么[笑哭]我拿电脑打开的,显示了两个框框[tv_生气]

学习 中文 计算机 乱码 编码 Unicode 柴知道 万物研究所 万物研究所·2022第四期

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!