「烫烫屯屯锟斤拷」揭秘ASCII、GBK、UTF-8，B站独家，一听就懂

作者: 码场安员外分类: 职业职场发布时间: 2022-05-08 22:59:17 浏览:104772 次

GGGloom:
手持两把锟斤拷，口中疾呼烫烫烫。脚踏千朵屯屯屯，笑看万物锘锘锘。

【回复】回复 @抱走胡桃_ :没什么意思就是个常见乱码打油诗[doge]
【回复】回复 @抱走胡桃_ :经常编程的人就知道，未初始化变量的值都是这个德行
【回复】回复 @萌新3340 :但是纯命令行下见过中文全是方块字口口口[doge]当然后面知道怎么解决了
孜然菠萝:
为什么windows默认使用GB18030，不使用utf8

【回复】乐～Windows在用户界面默认选用GB18030的唯一原因就是——历史包袱。现在的Windows内部只有一个字符集——UCS2。什么国家标准什么的不存在的……
【回复】严格来说，Windows里同时存在两套api，一套是ansi，一套是unicode。ansi接口在不同国家都会本地化成不同的字符集，gb18030就是ansi接口在中国本地化的结果。现在的程序按规范都应该调用unicode api，但是由于历史原因，很多老的程序，或者是英语国家开发的程序不在意字符集的问题，就会调用ansi的api。现在Windows每次升级都会挨一堆不兼容的批评，要是把ansi的接口这种根本性的东西去掉，那怕啥是会被骂上天，可以参照当年Intel不兼容32位的销售危机。毕竟Windows的兼容性就是最大的竞争力，现在的api你甚至能找到dos时代遗留的16位api。
【回复】主要的历史包袱有两个：1.部分程序使用字符集判断地区，你切UTF字符集直接干废这功能。2.部分程序仅支持DBCS或SBCS，你系统显示用其他的会直接把程序干崩掉。
幼刀之小丛雨:
恭喜你发现宝藏！烫烫屯屯｜锟斤拷� XX�許蓋功｜变巨｜林技夸｜朹方｜�> ��这� ��乱码到� ��怎么来的？通俗�> ��懂，小白友好�XX[201~

【回复】现学现用 <meta charest="UTF－8"/> [傲娇]
【回复】回复 @楚あ围 :哈哈，然后发现用的是vim编辑器但是是树莓派1.08系统
【回复】回复 @楚あ围 :杠要英文，中文不行
紧果呗:
省流：只要输入输出使用相同的编码方案就不会乱码。计算机开始设计时是其于ASCII这种包含128个基本字符编码方案开发出来的，有32个不可见的用于显示终端的控制字符，还有数学字母和常用符号。目前可表示最大字符集的编码方案是Unicode，有变长的utf8，有定长的utf16和utf32，可以表示特殊符号包括表情符号，如↹✅❎🔆®🎶📣📢🔕🍊🍋🍌。中文Windows系统开发出来时还没有Unicode所以默认使用中文专用的gbk简体中文编码方案。

【回复】补充一点，有了字符集定义还得有字体支持，定义了字符集就表示有了 Codepoint 和 Codepage，比如打出“中华”这两个字时，它们就具有码点、代码面属性，以帮助定位到字体文件对应的符号信息，然后再输出到屏屏上以图形方式显示出来。当然，不同的字符集编码方案对同一个字符的编码值是不一样的，这就涉及了编码间的转换操作，当输入、输出使用不同的编码方案处理时就产生乱码了。更多参考：https://www.bilibili.com/read/cv16786203
DecS3C:
使用vc开发的同学看到烫烫烫和屯屯屯可以检查下自己代码是不是野指针了

【回复】回复 @Tritone_00 :指针是个好东西[滑稽][doge]
【回复】回复 @叼着玫瑰的绅士狗 :内存危[tv_doge]
musicfans:
补充一下，现在的Unicode都有组合字符了，就是基本字符排在一起形成的更复杂的字符，组合字符就不是一个码点了，而是一连串码点，例如一家四口👨‍👩‍👧‍👦就是由👨🏻👩🏻👧🏻👦🏻组合的[doge][doge][doge]

【回复】使用零宽度连接符U+200D连接多个码位，在终端设备上会显示为一个字符。实际上还是一个码点，这个靠解释器显示成一个字符的，和阿拉伯文需要从右到左标记是差不多一个意思。如果说更像一点的，藏文，藏文是典型的组合字符。
布莱恩特-熊:
看了好几遍了，最好的解释编码的视频。刚刚看那个动画，突然理解了为什么有的字体不支持汉字了，是因为对应的字体库没有字符的轮廓信息[打call]

卢雷克:
捉个热乎的～员外、锟斤拷是gbk和utf8编码混乱产生的吗

谁是王建国:
windows默认gbk，写代码特别是Python都不敢写中文。改utf很多国内软件又不兼容...有时重编码保存，又把锟斤拷烫烫烫当做明码进行保存操作，改都改不回来....唉，累。

【回复】额，有没有一种可能，在记事本的另存为里面可以选择编码，写了中文用自带的IDLE打开时可以选择编码为GBK，之后再保存会自动给你转换为UTF-8
【回复】回复 @吃瓜群众之中 :不不不,一种编码保存另一种编码打开,让后在这个有【锟斤拷】的界面里写【我爱你】,之后再随便怎么保存.都是折磨. 特别是中间还参了两边都能正常读写的英文,你怎么改? 我觉得唯一的办法就是重创一个文件,然后两种方式分别打开一次原文件,把能读的部分无格式的复制粘贴过去,补成一个好的文件.
【回复】记得左下角应该是有个选字符集的东西，可以试试看能不能改
艾迟:
不是程序员，只是一些软件使用者，看了以后理解为什么用日语软件时要更改“非Unicode程序的语言”才能避免乱码了[笑哭]

奇怪的卒君琪:
仚僚鴅捙鴅捙鴅抂X区b捜掝鴅捜獋?鴅拑﹥捛鴅捜獌挀鴅?瑨气b?矑镍b?邙b捙鴆拡鵥抪f噿傍b抪f

iLuking:
之前存账号密码的文本文件乱码保存了，后来搜了一个切换编码的网站弄好了[妙啊]

原罪花环:
小白就想说一句，电脑手机的性能都被这些编码限制了，utf8还不是很好的编码器[doge][doge]

科技猎手编程超嗨挑战联盟乱码代码 UTF8

如果觉得我的文章对您有用，请随意打赏。您的支持将鼓励我继续创作！