「烫烫屯屯锟斤拷」揭秘ASCII、GBK、UTF-8,B站独家,一听就懂

作者: 码场安员外分类: 职业职场 发布时间: 2022-05-08 22:59:17 浏览:104772 次

「烫烫屯屯锟斤拷」揭秘ASCII、GBK、UTF-8,B站独家,一听就懂

GGGloom:
手持两把锟斤拷,口中疾呼烫烫烫。 脚踏千朵屯屯屯,笑看万物锘锘锘。

【回复】回复 @抱走胡桃_ :没什么意思 就是个常见乱码打油诗[doge]
【回复】回复 @抱走胡桃_ :经常编程的人就知道,未初始化变量的值都是这个德行
【回复】回复 @萌新3340 :但是纯命令行下见过中文全是方块字口口口[doge]当然后面知道怎么解决了
孜然菠萝:
为什么windows默认使用GB18030,不使用utf8

【回复】乐~Windows在用户界面默认选用GB18030的唯一原因就是——历史包袱。现在的Windows内部只有一个字符集——UCS2。 什么国家标准什么的不存在的……
【回复】严格来说,Windows里同时存在两套api,一套是ansi,一套是unicode。ansi接口在不同国家都会本地化成不同的字符集,gb18030就是ansi接口在中国本地化的结果。现在的程序按规范都应该调用unicode api,但是由于历史原因,很多老的程序,或者是英语国家开发的程序不在意字符集的问题,就会调用ansi的api。现在Windows每次升级都会挨一堆不兼容的批评,要是把ansi的接口这种根本性的东西去掉,那怕啥是会被骂上天,可以参照当年Intel不兼容32位的销售危机。毕竟Windows的兼容性就是最大的竞争力,现在的api你甚至能找到dos时代遗留的16位api。
【回复】主要的历史包袱有两个:1.部分程序使用字符集判断地区,你切UTF字符集直接干废这功能。2.部分程序仅支持DBCS或SBCS,你系统显示用其他的会直接把程序干崩掉。
幼刀之小丛雨:
恭喜你发现宝藏!烫烫屯屯|锟斤拷� XX�許 蓋功|变巨|林技夸|朹方|�> ��这� ��乱码到� ��怎么来的?通俗�> ��懂,小白 友好�XX[201~

【回复】现学现用 <meta charest="UTF-8"/> [傲娇]
【回复】回复 @楚あ围 :哈哈,然后发现用的是vim编辑器但是是树莓派1.08系统
【回复】回复 @楚あ围 :杠要英文,中文不行
紧果呗:
省流:只要输入输出使用相同的编码方案就不会乱码。 计算机开始设计时是其于ASCII这种包含128个基本字符编码方案开发出来的,有32个不可见的用于显示终端的控制字符,还有数学字母和常用符号。 目前可表示最大字符集的编码方案是Unicode,有变长的utf8,有定长的utf16和utf32,可以表示特殊符号包括表情符号,如↹✅❎🔆®🎶📣📢🔕🍊🍋🍌。 中文Windows系统开发出来时还没有Unicode所以默认使用中文专用的gbk简体中文编码方案。

【回复】补充一点,有了字符集定义还得有字体支持,定义了字符集就表示有了 Codepoint 和 Codepage,比如打出“中华”这两个字时,它们就具有码点、代码面属性,以帮助定位到字体文件对应的符号信息,然后再输出到屏屏上以图形方式显示出来。当然,不同的字符集编码方案对同一个字符的编码值是不一样的,这就涉及了编码间的转换操作,当输入、输出使用不同的编码方案处理时就产生乱码了。 更多参考:https://www.bilibili.com/read/cv16786203
DecS3C:
使用vc开发的同学看到烫烫烫和屯屯屯 可以检查下自己代码是不是野指针了

【回复】回复 @Tritone_00 :指针是个好东西[滑稽][doge]
【回复】回复 @叼着玫瑰的绅士狗 :内存危[tv_doge]
musicfans:
补充一下,现在的Unicode都有组合字符了,就是基本字符排在一起形成的更复杂的字符,组合字符就不是一个码点了,而是一连串码点,例如一家四口👨‍👩‍👧‍👦就是由👨🏻👩🏻👧🏻👦🏻组合的[doge][doge][doge]

【回复】使用零宽度连接符U+200D连接多个码位,在终端设备上会显示为一个字符。 实际上还是一个码点,这个靠解释器显示成一个字符的,和阿拉伯文需要从右到左标记是差不多一个意思。 如果说更像一点的,藏文,藏文是典型的组合字符。
布莱恩特-熊:
看了好几遍了,最好的解释编码的视频。刚刚看那个动画,突然理解了为什么有的字体不支持汉字了,是因为对应的字体库没有字符的轮廓信息[打call]

卢雷克:
捉个热乎的~员外、锟斤拷是gbk和utf8编码混乱产生的吗

谁是王建国:
windows默认gbk,写代码特别是Python都不敢写中文。改utf很多国内软件又不兼容...有时重编码保存,又把锟斤拷烫烫烫当做明码进行保存操作,改都改不回来....唉,累。

【回复】额,有没有一种可能,在记事本的另存为里面可以选择编码,写了中文用自带的IDLE打开时可以选择编码为GBK,之后再保存会自动给你转换为UTF-8
【回复】回复 @吃瓜群众之中 :不不不,一种编码保存另一种编码打开,让后在这个有【锟斤拷】的界面里写【我爱你】,之后再随便怎么保存.都是折磨. 特别是中间还参了两边都能正常读写的英文,你怎么改? 我觉得唯一的办法就是重创一个文件,然后两种方式分别打开一次原文件,把能读的部分无格式的复制粘贴过去,补成一个好的文件.
【回复】记得左下角应该是有个选字符集的东西,可以试试看能不能改
艾迟:
不是程序员,只是一些软件使用者,看了以后理解为什么用日语软件时要更改“非Unicode程序的语言”才能避免乱码了[笑哭]

奇怪的卒君琪:
仚 僚鴅捙鴅捙鴅抂X区b捜掝鴅捜獋?鴅拑﹥捛鴅捜獌挀鴅?瑨气b?矑镍b?邙b捙鴆拡鵥抪f噿傍b抪f

iLuking:
之前存账号密码的文本文件乱码保存了,后来搜了一个切换编码的网站弄好了[妙啊]

原罪花环:
小白就想说一句,电脑手机的性能都被这些编码限制了,utf8还不是很好的编码器[doge][doge]

科技猎手 编程 超嗨挑战联盟 乱码 代码 UTF8

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!