70年前他本想逃避考试,却影响了整个互联网


谁曾想,一次学生不想参加考试的“任性”,后来竟影响了整个互联网。

70年前MIT的一堂信息论课上,一位老师为了给学生“减压”,摆出一道选择题。

要么参加期末考试,要么写篇论文改进现有算法,自己挑。

这位老师名叫罗伯特·范诺,他没告诉学生们的是,这个“现有算法”,正是他和信息论创始人香农合著的香农-范诺编码。而为了改进算法不足,他本人已经投入大量时间进行研究。

(老师内心OS:没想到吧。)

虽然有点损,但这招还真管用。这票学生一听“交篇论文”就不用考试,拍脑袋就决定写论文,包括大卫•哈夫曼

不选不知道,一选吓一跳。初出茅庐的哈夫曼很快意识到了老师挖的坑——这论文也太**难搞了。

这一写,就是好几个月,并且苦苦挣扎中,哈夫曼仍然一无所获。

但命运,有时候就是十分奇妙。就在哈夫曼终于放弃“逃考”,准备将论文笔记扔到垃圾桶中时,突然灵光一现!答案出现了!

哈夫曼放弃对已有编码的研究,转向新的探索,最终发现了基于有序频率二叉树编码的方法。

他提出的这一想法,效率成功超越他老师的方法论。甚至在之后的发展中,以他命名的编码方法——哈夫曼编码,直接改变数据压缩范式。

至于当时那篇结题报告,已引用近万次。

低效的传统编码方法

1951年,正在MIT任教的罗伯特·范诺正在思考一道信息论的难题:

如何用二进制代码高效表示数字、字母或者其他符号?

当时最常见、也是最直接的方法,就是为每个字符分配一个独一无二的二进制数。

比如,字母A可能表示为01000001,!表示为 00100001,每个八位数的数字都对应一个字符。

这样一来代码容易解析,但效率极低。

另外还有种优化方法,类似于摩尔斯电码。常用字母E仅由一个点表示,但不常见的Q需要更长且更费力的“—— —— · ——”。

这种方式,会导致代码长度不一, 信息不容易被理解;而且传输中还需要在字符间加入间隙,否则就无法区分不同的字符组合。

范诺意识到,或许这两种方法的优势可以兼并之——以不同长度的二进制代码表示字符。进一步地,为避免代码“重叠”,他还构建了二叉树。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

70年前他本想逃避考试,却影响了整个互联网图片

他详尽地测试了每一种排列的可能性以获得最大效率,最终得到了一种有效情况:

每条消息按照频率分为两个分支,并尽可能让两边字母使用频率基本相同

70年前他本想逃避考试,却影响了整个互联网图片

这样,常用的字符就会在更短、密度更低的分支上。

1948年,信息论之父香农在介绍信息理论的文章“通信数学理论”中提出了这一方法;不久之后,范诺也独立地以技术报告形式将其发布。故而这套方法被称作是香农-范诺编码

但这个方法并非总是有效。像字母出现概率分别为{0.35,0.17,0.17,0.16,0.15}这种情况时,就不能给出理想编码。

范诺认为一定存在更好压缩策略。于是乎,这样的重任就交到了他的学生手里。

一次灵光乍现,一篇世纪论文

如果说,范诺教授他们的方法是从上到下构建字符树,并在成对的树枝之间尽可能保持对称。

那么哈夫曼的方法,是直接颠覆了这一过程——自下而上构建二叉树

他认为,无论发生什么情况,在一段有效的代码中,两个最不常见的字符应该有两个最长的代码

因此首先就确定两个最不常见的字符,将它们组合在一起作为一个分支对,然后再重复该过程,再从剩余字符中与刚刚构建的字符对中寻找最不常见的字符(对)。

ChatGPT Writer ChatGPT Writer

免费 Chrome 扩展程序,使用 ChatGPT AI 生成电子邮件和消息。

ChatGPT Writer 106 查看详情 ChatGPT Writer

70年前他本想逃避考试,却影响了整个互联网图片

schoolroom为例,其中O出现了四次,S、C、H、L、R、M各出现一次。

范诺的方法,就是首先将O与另一个字母分配给左侧分支,这样一来两边都是5次总使用量,生成的编码总共27位。

70年前他本想逃避考试,却影响了整个互联网图片

相比之下,哈夫曼的方法,比如就从不常见的r和m开始,将其组合成一个字母对。

70年前他本想逃避考试,却影响了整个互联网图片

组合完之后,现有字符(对)包括:O(4次)、RM(2次)以及单个字母S、C、H和L。

按照出现频率划分,重复上一操作——将两个不常见的选项分组,然后更新数树和频率图。

70年前他本想逃避考试,却影响了整个互联网

最终,“schoolroom”变成了 11101111110000110110000101,比Fano 自上而下的方法少了1位 

70年前他本想逃避考试,却影响了整个互联网图片

虽然1位在这里并不多,但要是当扩展到数十亿字节时候,这就是一次不小的节省。

事实上,哈夫曼的方法已经被证明非常强大,据谷歌学术统计,当年论文已经被引用9570次。

70年前他本想逃避考试,却影响了整个互联网图片

至于他老师的办法,却几乎没有再被使用过。

直至今天,几乎所有无损压缩方法都全部或部分使用了哈夫曼的方法,可以压缩图像、音频、表格等。它支持从PNG图像标准到无处不在的软件PKZip 的一切。

现代计算机科学先驱、图灵奖得主高德纳曾这样形容哈夫曼的成就:

在计算机科学和数据通信领域,哈夫曼编码是人们一直在使用的基本思想。

后来哈夫曼再回忆起那个「灵光乍现」时刻,当时他正准备将论文笔记扔进垃圾桶,结果突然思想汇聚,答案在脑海里出现了:

那是我生命中最奇特的时刻。

突然恍然大悟,犹如闪电一般。

并表示,如果他知道自己的教授范诺(Fano)曾与这个问题作过斗争,他可能永远都不会尝试解决这个问题,更不用说在25岁的时候就大胆去尝试。

成就与秩序感,用数学玩艺术

哈夫曼编码改变了数据压缩范式,也为其赢得了众多荣誉与奖章。

比如,1998年哈夫曼获得 IEEE 信息理论学会颁发的技术创新金禧奖、1999年获得电气和电子工程师协会 (IEEE) 颁发的理查德·汉明奖章(Richard Hamming Medal)。

不过即便如此,在他一生历程中,相比发明无损压缩方法这件事儿,最让他引以为傲的反而是这篇博士论文。

题目:The Synthesis of Sequential Switching Circuits

70年前他本想逃避考试,却影响了整个互联网图片

哈夫曼在MIT读博期间,发布这篇讨论时序开关电路的重要论文。在当时,哈夫曼几乎是首个阐述如何设计异步顺序开关电路的学者,而这一理论后来也为计算机发展提供了重要逻辑支撑。

这篇论文的发布,不仅帮助他获得富兰克林研究所的Louis E. Levy Medal,也顺理成章让他获得留校任职资格,教授关于开关电路的课程。

70年前他本想逃避考试,却影响了整个互联网图片

在校期间,哈夫曼还提出一种革新的数学公式,可以在不丢失任何信息的情况下将一个二进制数序列转换成另一个二进制数序列,这项研究在当时发挥了重要作用,也为其谋得了一份重要职位。

时任贝尔实验室研究副总裁的William O. Baker将其招纳入了一个审查委员会,主要负责为国家安全局审查未来科技计划。Baker博士曾担任过艾森豪威尔、肯尼迪、约翰逊、尼克松和里根五位总统的科学顾问。

1967年已是正教授的霍夫曼选择离开MIT,加入加利福尼亚大学圣克鲁兹分校(UCSC),期间主导创立了计算机科学系,并参与学术课程开发工作,为之后计算机科学系发展奠定重要基础。

数学可以说是哈夫曼毕生追求之一,以至于后来在搞艺术时,也离不开数学。

70年前他本想逃避考试,却影响了整个互联网图片

70年代开始,哈夫曼对折纸产生浓厚兴趣,同时研究数学和折纸艺术,制作了上百件曲痕折纸作品,还专门发表论文分析曲痕折纸的数学性质,成为折纸数学领域的先驱人物。

70年前他本想逃避考试,却影响了整个互联网
70年前他本想逃避考试,却影响了整个互联网

回过头看,哈夫曼的一生赢得过无数荣誉与表彰,却从未为自己任何一项发明申请过专利。

最后,借用哈夫曼自己的一段话。

作为一名科学家和老师,我真的非常执着。如果我觉得自己还没有找到问题的最简单解决方法,我会非常不满意,这种不满会一直持续,直到我找到最佳方法为止。对我来说,这就是科学家的本质。

以上就是70年前他本想逃避考试,却影响了整个互联网的详细内容,更多请关注其它相关文章!


# 数学  # 新疆网站推广的几种方式  # 逐本的营销推广怎么做  # seo激活  # 关键词网络推广公司排名  # 灯饰网站建设哪家便宜些  # 这篇  # 罗伯特  # 自己的  # 将其  # 开源  # 香农  # 这一  # 年前  # 本想  # 互联网  # 论文  # 浦东网站推广广告  # 商城矩阵推广营销方案  # 唐山全网营销推广系统  # seo关键词论文  # 香洲网站优化 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: 从GOXR到PartyOn,XRSPACE致力打造多元共赢的元宇宙世界  电力人工智能数据集目录首次发布  “具身智能”引爆机器人产业,看绝影Lite3/X20四足机器人有何特别之处?  【搞事】时隔4年 谷歌更新安卓logo 机器人头更饱满了  Snap宣布研发出新技术 可大幅提升AI生成图像速度  智能电网技术:提高能源效率和可靠性  7/8上海 | 2025世界人工智能大会分论坛:科技与人文-共筑无障碍智能社会  复盘MWC上海:AI大模型时代到来 通信网络将会怎样改变?  三星加速AR眼镜进程,预计明年上半年亮相  探索人工智能在物联网领域的影响与改变  马斯克称人类是半机器人,记忆外包给了电脑  华为云发布华为云盘古模型3.0和升腾AI云服务,亮点亮相2025华为开发者大会  2025VR&AR显示技术峰会展示歌尔光学最新一代光学模组  数据显示:人工智能相关专业热度上升最快 考古、美术、生物医学工程等小众专业火了  AI生成会议纪要 百度如流升级推出超级助手、智能编码等功能  售价14.99万起!小米汽车部分信息疑遭AI曝光,内部人士回应:网传图片明显经过处理,不可轻信  Adobe旗下Illustrator引入生成式AI工具Firefly  人工智能框架生态峰会即将召开,聚焦AI大模型技术与科学智能探索!  边喷火边跳踢踏舞,机器狗最新技能爆火全网!网友直呼真·热狗  OpenAI 向所有付费 API 用户开放 GPT-4  智能机器人正在彻底改变客户服务  国产工业机器人领域“暗潮涌动”,即将迎来新一轮复苏  AI+音乐如何“生成”动听旋律?一起揭秘世界人工智能大会开场曲  编程版GPT狂飙30星,AutoGPT危险了!  月薪6万,哪些AI岗位在抢人?  人工智能写作检测工具不靠谱,美国宪法竟被认为是机器人写的  东软成立魔形科技研究院,积极布局大语言模型系统工程战略,迎接AI时代  “三夏”农忙保障用电,无人机高空巡视高压线  厂商陆续公布AI进展 完美世界游戏展示复合应用AI in GamePlay  移远通信率先完成多场5G NTN技术外场验证,为卫星物联网应用落地提速  AI室内设计软件流行,室内设计行业如何应对效率变革  传字节内测对话式 AI 产品,代号「Grace」;马斯克嘲讽苹果 头显;比亚迪 F 品牌定名「方程豹」  一公司推出喷火机器狗,可喷出 9 米长火焰  MiracleVision视觉大模型上线时间  利亚德加码AI战略,与光年无限图灵机器人全面开展AI研发业务合作  OpenAI已向中国申请注册“GPT-5”商标,此前已在美国提交申请  小艺将具备大模型能力,鸿蒙4加速AI普及之路  此「错」并非真的错:从四篇经典论文入手,理解Transformer架构图「错」在何处  腾讯AI首次模拟拼接三星堆文物,工作取得阶段性的成果  鸿蒙4即将支持大规模AI模型  鸿蒙OS 4将实现AI大模型集成,余承东表示坚持AI辅助而非AI取代  全新小艺搭载AI大模型,有效提升学生和职场人士的工作效率  DreamAvatar数字人使用教程  高质量数据推动AI场景化应用快速发展及落地  猿辅导发布最新SaaS业务进展公告:Motiff UI设计工具推出三项新的AI功能  五项人工智能尚未能够实现的任务  AYANEO AIR 1S 掌机 7 月 9 日发布:R7 7840U + OLED 屏  马斯克讽刺人工智能炒作:什么“机器学习”,其实就是统计  2025“春晖杯”人工智能专场对接活动举办  长宁这家企业在世界人工智能大会上荣获“蓝鼎奖” 

 2023-06-27

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.