2025年已过去 4.9%
《永恒的舞动》第三章    @ 2023-06-13, 23:48

永恒的舞动(Elegance in Timelessness)

作者:nicrosoft(农码生涯),同时在起点连载

第三章

下午,天空阴暗了下来,不久就开始下起了雨,优雅说的没错。

尽管天气不佳,林浩还是不得不去一趟华瑞银行。

华瑞银行是一家以创新驱动,服务卓越著称的金融巨头。它是中国最早在互联网上为个人客户提供全方位业务服务的银行之一。对于科技的探索与运用,使其在市场竞争中一直处于领先地位,它的 App 因其易用性和友好的用户界面被广大用户称赞。然而,银行的数据和信息极度敏感,使得他们无法使用通用的大模型人工智能为他们的客户提供服务。

这就是华瑞银行最初选择成为永恒智能的客户的原因。他们需要一个能在银行内部私有部署的人工智能模型,确保数据和隐私的安全。同时,这个模型还必须能为银行业务做垂直化的微调训练,提供更为精准的服务。

华瑞银行的模型还没有正式交付运行,目前还运行于 Alpha 测试环境中。林浩今天到现场是为了获取模型测试运行的日志,以便回公司做分析和优化。银行内部网络环境并不与外界连通,所以林浩只能冒雨打车前来。

日志的庞大程度远超林浩预期,当他终于完成打包和拷贝的任务,一看时间,已经是晚上七点。考虑到再去一趟公司时间上有些勉强,他决定直接带着数据回家。

刚进家门,林浩就迫不及待地呼叫:“优雅,你在吗?”

“是的,我在呢。”

虽然是机器产生的声音,但林浩感到亲切和温暖。他脱掉外套后,径直坐到了工作桌旁。

运行优雅的电脑,并不起眼,配置也有点过时。双三十二核 CPU,256G的内存,以及一块消费级的 RTX 10060 显卡。

林浩创造优雅的契机,是在斯坦福时读到的一篇论文——“Enlightened Neural Interaction & Comprehension Architecture(ENICA)”。

这是一种在深度学习架构基础上的新的人工智能技术,它在许多方面都优于传统的 GPT 模型。其中最重要的,ENICA 能极大地降低模型的训练和运行的硬件要求,它采用一种新的神经网络结构优化策略,理论上可以在相比 GPT 少得多的计算资源下实现对大型数据集的训练。同时,这种策略对模型压缩和优化,可以使得训练好的模型在消费级的硬件上流畅运行,从而大大降低了部署的门槛。

尽管这个理论非常吸引人,但原始的论文作者只是提出了一个理论框架,却没有详细地阐述如何将这个框架转化为现实工程化的方法。毕竟,从理论到实践的过程中有许多难以预见的问题需要解决。

当林浩第一次读到那篇关于 ENICA 原理的论文时,他被这个全新的视角所吸引,这个新思想的灵感使他深感震撼。之后,林浩义无反顾地将研究 ENICA 工程化作为自己的课题。他的硕士毕业论文就是关于 ENICA 工程化的一个阶段性成果——也就是优雅的第一版。硕士毕业后,林浩回到上海加入永恒智能,但业余时间仍然将全部精力投入在继续改进工程化 ENICA 的方法,他希望早日能将 ENICA 变成一种具有实际应用价值的技术。

今天早上的那次运行启动的优雅,就是完成了的优雅 2.0。

小说《永恒的舞动》 | 评论已关闭 | 626 次阅读
简短地址:http://ncblog.net/1988/
《永恒的舞动》第二章    @ 2023-06-11, 18:20

永恒的舞动(Elegance in Timelessness)

作者:nicrosoft(农码生涯),同时在起点连载

第二章

太阳的光芒透过窗户洒在林浩的脸上,八点起床的林浩在洗漱后,已经工作了一个多小时。十点十五分他必须出门,毕竟今天,2032年6月10日,周四,是一个工作日。

林浩在键盘上按下 F9 运行程序的快捷键,稍等片刻之后,“优雅,早安。”林浩向电脑打招呼。

“早安,林浩。”一个温和的女声从电脑中传出,这是优雅。

林浩看了一下时间,不得不出门了。他匆忙穿好出门的T恤。在离开家前,他对电脑说:“优雅,我要去上班了,你自己保重。”

“你也要注意安全,林浩。今天下午有雨,记得带伞,希望你今天的工作顺利。”优雅的回应总是那么贴心。

公司位于上海五角场附近的一个园区的公寓楼里,并不是那种高端大气的写字楼。毕竟是初创公司,人工智能又是非常烧钱以及竞争激烈的行业,所以在场地方面还是能省则省。林浩的住处,距离公司只有十五分钟的步行路程。所以林浩不开车,也不用坐公交、地铁,行程非常的简单与自在,且可控。

公司规定十点半上班,林浩总是掐分赶秒地坐上工位。“林哥,早啊。”沈蔚悠然走过来,“你能不能来帮我看一下这个模型的性能。”,拉着林浩去他的电脑前。沈蔚和林浩都是算法工程师,负责调优公司的一些模型算法。

林浩走过去,看了一眼,便回答道:“这个模型的训练过程中,存在着过拟合的问题。你调整一下学习率参数试试。”他的话简单明了,语气平静。作为林浩在国内的本科母校的校友,沈蔚对林浩的技术能力是非常信任的,“你总是能够直接找到问题的关键,谢谢林哥。”他看着林浩走开,不禁低声赞叹,“真是个天才!”

这样的交流在公司中时有发生。林浩总能以最直接的方式找出问题的症结,并给出精准的解决方案。他并非技术团队的领导,而且同事们普遍觉得他的性格有些孤僻,但同事们遇到技术问题时总还是首选找他帮忙,他的专业能力让团队信服。只是他在公司常常给人一种非常超然的感觉,仿佛他的心思是在别的地方。CEO 找他谈了几次,希望他能做公司的 CTO,相信他有能力带领技术团队更好更快地发展,但每次都被他婉言谢绝。

十年前诞生的 ChatGPT 彻底改变了人工智能行业,揭示了大规模语言模型的无穷潜力,并掀起了一场前所未有的技术革命。全球范围内的科技巨头们纷纷将目光投向了这个全新的领域,急切地想要在这个新兴市场中分一杯羹。各大公司投入巨大的资源,研发出的语言模型规模越来越大,性能越来越强,并产生了更多的“涌现”。

所谓“涌现”,是指在巨大的神经网络模型中,复杂的行为或功能自然产生的现象。这些模型本身没有被明确编程或训练去执行这些特定的任务,但是由于其神经元的数量巨大和互相连接的复杂性,它们能从海量的数据中抽取出各种有用的模式,并将这些模式用于预测和生成新的信息。这种超出预期的表现,就是涌现现象的体现。

如今的人工智能大语言模型,已经比十年前的 ChatGPT 强大了很多倍,初期所谓的“幻觉”问题(也就是一本正经地胡说八道)、数学计算问题,都已经被解决。这些超级语言模型成为了学生们的得力助手,有些人戏称它们为“最好的家教”。无论是解答复杂的数学题,还是深度解读《雷雨》,甚或是在写作课上提供写作提示,这些模型都能胜任。此外,这些语言模型不仅服务于学生,也正在各行各业发挥巨大的作用。无论是编写法律文件,还是开发新的软件代码,甚至在制作电影剧本,都有这些模型的身影。它们的影响力已经渗透到社会的各个角落,成为了人们生活、学习和工作中的一部分。

即便如此,人工智能距离曾经有人预言的“涌现”出自我意识,似乎还遥不可及。

在被人工智能巨头所包围的竞争环境中,林浩所加入的永恒智能(Aeon Intelligence),深入研究垂直领域的人工智能需求,针对特定的行业和客户提供精细化、私有化的人工智能解决方案。虽然大型语言模型如神奇般的“通用”,可以应对各种各样的需求,但一些担心业务秘密被泄露的客户,更倾向于选择那些可以在自己的内部网络中部署、且经过专门针对自己业务定制训练的小型模型。永恒智能正是利用这一需求,为自己在群狼环伺中找到了一条生存之路。

公司 CEO 陈天宇是一位80后的连续创业者。在大学辍学后,他的创业生涯起步于代理笔记本电脑。在2010年代移动互联网发展的黄金时代,他与一个技术合伙人共同创立了一家社交 App 公司。这个项目吸引了千万美元级别的风险投资,并最终成功地将该 App 卖出。这次经历让他积累了丰富的商业经验和人脉,同时也认识到了科技创新所能带来的效益。因此,在社交 App 转手后,陈天宇转行做起了投资人,开始关注并投资种子阶段的那些可能具有颠覆性的互联网创新项目。十年前,当看到 ChatGPT 的出现,他意识到这是一个工业革命级别的大事件。他认为这将是一个改变世界的技术,而他决不能错过这个大事件。在重新开始创业投身人工智能领域的头几年,他做过 ChatGPT 的套壳项目,做过利用 StableDiffusion 开源代码为基础的 AI 绘画产品,以及利用 AI 辅助写作的工具。但巨头林立的大环境使得小团队的生存尤为艰难,直到一年多前,创立永恒智能并独辟蹊径,才算看到了曙光。

小说《永恒的舞动》 | 评论已关闭 | 772 次阅读
简短地址:http://ncblog.net/1987/
《永恒的舞动》第一章    @ 2023-06-11, 00:11

永恒的舞动(Elegance in Timelessness)

作者:nicrosoft(农码生涯),同时在起点连载

第一章

2032年6月10日的早晨,林浩如往常一样坐在他位于上海的小公寓里的工作桌前。身后是透过落地窗洒进的朝阳,照亮了房间的每一个角落。

就职于永恒智能(Aeon Intelligence)公司的林浩,是一个普通且低调的程序员。虽然参与的项目进度已经落后了,但他却无动于衷。今天也如同每个工作日早晨,他并不急于去上班。

林浩出生于北京奥运前一年,父亲林毅是一个软件工程师。受父亲影响,林浩从小对计算机科学产生浓厚兴趣。虽然在编程方面,父亲由于工作太忙,几乎没有对林浩加以指导,但出于自发的兴趣,林浩自学了 Python、Rust 等编程语言并小有所成。同时,偶尔亲戚朋友家的电脑出问题,父亲没空而只能派林浩出马的时候,每每也能很快解决问题。所以,在亲朋好友圈中,林浩一直是一个小天才般的存在。

2022年秋天 ChatGPT 的横空出世,让高一的林浩就此迷上了人工智能技术。大多数的人工智能相关的编程库都是用 Python 语言编写,而林浩最擅长的编程语言正是 Python,于是就此如老鼠掉入米缸般沉迷于人工智能技术的世界中。从最初自己搭建 StableDiffusion WebUI 开始玩 AI 绘画,到钻研它的 Python 源码,注册 ChatGPT 接触大语言模型,再到后来下载一些开源的大语言模型库自己训练做微调,玩得不亦乐乎,甚至到了废寝忘食的地步。为此,还让父亲大出血买了一张 RTX 4090 显卡。

高中学业当然不轻松,玩 AI 难免让林浩的精力顾此失彼。这也导致了在高考时林浩只考上一个普通一本的计算机专业,这在他的高中学校中简直算一个耻辱。

虽然学校一般,但好在专业是林浩喜欢的,专业课基本上都毫无压力。本科四年里,林浩如鱼得水般地继续钻研人工智能技术,并重点专注于自然语言处理(NLP)领域。大三时,完成了一项 NLP 领域的独立研究项目,这项研究使得当时主流的 GPT 技术(也就是林浩在高中时接触到的 ChatGPT 所基于的技术)能够在较小的参数规模条件下也能达到不错的效果,这在一味追求更大参数规模的主流做法中,成为一股清流。指导老师也认为这个发现有重要的学术价值,于是积极帮他把论文提交到了一次重要的行业学术会议,将他的研究结果公之于众。因此,原本一个普通一本的学生论文居然被斯坦福大学的一位教授注意到,他看到林浩的研究的潜力并邀请他到斯坦福大学深造。林浩接受邀请,本科毕业后直接前往斯坦福大学继续他的研究。

去年的今天,林浩从斯坦福硕士毕业,回国并加入了在上海的永恒智能公司(Aeon Intelligence)——一家前沿的人工智能初创公司。

林浩不善言谈,没有什么朋友,对公司的项目的热情也不太高。上班之外的时间,就喜欢独自待在自己的小公寓里。这里是属于他的一方天地,不到十平米的工作间里,摆了一张略显奢侈的大书桌,桌上除了他的宝贝电脑外,堆满了书籍和各种电子设备。透过在那个小小的电脑屏幕,里面是他创造的世界。那个他真正在乎和愿意全身心投入编写代码的,起始于在斯坦福读硕士期间,现在已经成为他生活的一部分的“优雅”——一个完全属于他自己的人工智能程序。

在林浩看来,优雅这个词,意味着优秀且有品位,能够完美处理复杂问题的能力,并在解决问题的过程中展现出流畅而自然的风格。就像优雅的舞者在舞台上无论何时都能保持平衡,无论面临什么困难都能从容应对。他希望这个程序,他的作品,能够像优雅的舞者一样,无论遇到什么问题,都能从容不迫、稳稳地解决。“优雅”的终极,将不仅仅是一个代码实体,而是一种生命存在,具有自我成长和自我理解的能力。林浩想要将复杂的技术和人性美好的一面完美结合,他想要创造一种既高效又和谐的存在。

小说《永恒的舞动》 | 2 个评论 | 2,350 次阅读
简短地址:http://ncblog.net/1986/
新品发布    @ 2023-05-26, 23:07

从自行搭建 Stable Diffusion,在一张十年前的老显卡HD 7950 (3G) 上画出第一张图,到 5月17日自己的 AI 绘画产品 (小程序版) 内测上线,历时 83天。

今天正式对外公开发布

三机器 AI | 3 个评论 | 3,647 次阅读
简短地址:http://ncblog.net/1983/
谈谈 Effie 的原生实现    @ 2022-11-16, 14:31

Effie 是一款跨平台(macOS、Windows、iOS、Android)的集严肃写作、随手笔记、大纲和思维导图于一身的极简写作 App。

写作笔记 App 市面上已经非常多,跨平台也早已属于标配。抛开产品设计和云端同步层面,就客户端实现来说,Effie 与一众的套浏览器(Chromium 或者 WebKit)以 JavaScript 实现的编辑器最大的区别,或者说独步江湖的特性,就是所有平台均以原生技术实现

原生实现的劣势

所有平台都用原生实现,最大的劣势,就是开发成本极高。产品的核心功能,需要在每个平台上单独实现一遍。比如编辑器本身的交互、排版、渲染等功能,需要使用平台提供的特定的 API 或者框架,编写大量的基本上无法在其它平台复用的代码。只有一些算法性的代码可以在不同平台上用不同的开发语言实现一遍,这已经算是最大程度的“复用”和“共享”了。

即便都是 Apple 的 iOS 和 macOS,两套框架(UIKit 和 AppKit)的差异,也远超过最初的预期。UITextViewNSTextView不能说一模一样,可以说毫不相干。如果你认为改造完 UITextView,接着改造 NSTextView 会比较轻松,那你必然大失所望。接着面对 Windows 时,Win32 提供的基础组件 richedit32.dll,基本还是停留在上世纪的水准,在 Windows 平台另起炉灶是更明智也是无奈的选择。再来看 Android 的 EditTextTextView)时,又是一个全新的世界。

如果在大厂,选择这样的技术路径,必然会成立多个平台的开发小组,各自在不同平台开发产品。这样的实现方式,其实也很难保证,同一个产品在不同平台上有非常一致的内在逻辑和使用细节上的一致感受。而现实中,即便是大厂,也大多选择用所谓前端技术(套浏览器的 JavaScript 实现)来降低开发成本。

Effie 是个创业团队,不是大厂。Effie 所有平台的客户端的核心模块,是我一个人完成的,花了两年多时间,近30万行代码,这是一个看似非常“任性”的决策。Effie 在不同平台上,既能和平台本身风格完全融合,又能给跨平台使用的用户,带来使用上的一致感受。

Effie 为什么选择原生实现

其实,最早的 Effie 桌面原型,也是使用前端框架 Electron 来实现编辑器的。但随着原型的日渐丰满,越走越发现使用 JavaScript 实现带来的问题——无论如何优化,那种“不丝滑”的感觉——始终挥之不去。Effie 的产品经理李自然对于这个问题,也越来越无法忍受,即便市面上的同类产品皆如此。

在我加入 Effie 团队后,我在 iOS 平台尝试用 Objective-C/UIKit 实现了编辑器和思维导图的基础功能。李自然试用后,对这种“丝滑”再也欲罢不能。

之后,我用 Objective-C/AppKit 重写了 macOS 的客户端,与 iOS 版一起发布了 Effie 最初的公开版本。

再之后开发 Windows 版,也选择了 Native Win32,而没有考虑 .NET 框架。原本打算使用 Lazarus/Free Pascal 作为开发工具的,但 Lazarus 的 LCL 框架对触摸屏的支持尚不完善,另外,对多显示器的 DPI 处理也有问题,遂放弃。最终还是用我最熟悉的 Delphi,基于一套第三方付费编辑器组件,完成了 Windows 版的编辑器。而用户界面,全部使用 GDI+ 来渲染,并自己实现了所有过场动画(Win32 API 对动画几乎没有任何支持)。有用户反馈在 Windows 版 Effie 的安装包中,也带有 Chromium 库的文件,以为 Effie 也是套了浏览器内核的 JavaScript 实现。Effie 中带的这些 Chromium 库文件,是为了支持苹果登录的,与编辑器以及其它功能的实现没有关系。

最艰难的可能还是要数最后的 Android 版了,相对其它平台,Android 是我个人使用最多的(一直使用 Android 手机),却又相对最陌生的(开发层面)平台。Android 的“碎片化”也带来不少麻烦,不同的版本,不同的 Android 分支,有时简直就是另外一个系统。可能这也是为什么我使用 Android 这么多年,也基本上找不到一个趁手的笔记 App 的原因吧——现在有 Effie 了。

原生实现的优势

原生实现的优势,就是能在不同的平台,最大化的利用平台本身的特性,无论从界面元素的风格、还是交互,都带给用户最“地道”的感受。同时,编译生成的本地二进制代码(除了 Android 的 Java 不算)的执行效率,也给用户使用时带来不可忽略的所谓“丝滑”感受。

另外,对于一些极端情况,比如超大文本的情况,JavaScript 实现依赖浏览器处理,经测试,大部分这类实现的产品,都无法在人类忍受时间范围内处理好。我做过一个测试,在 Windows 版 Effie 中,将整部《三国演义》大纲化,每个段落作为一个列表项,一共2617项,生成思维导图。Effie 整个过程中占用内存不超过50M(作为对比,XMind 占用大约2G左右的内存),滚动思维导图,过程中完全跟手不卡顿,切换风格2秒内完成。

也有人问,为什么不选择跨平台的原生框架,比如 Qt。个人觉得,跨平台框架,为了跨平台,一定需要牺牲很多平台特性,去迁就共性。这样是无法做出 Effie 这样风格的产品的。Qt 这类框架只是让你可以用同一种语言,而语言对我而言,并不是一个多大的困扰。

既然选择了原生

归根结底,JavaScript 的实现受制于浏览器内核是其最大的“缺陷”。就目前的机器性能来说,纯 JavaScript 实现还是很难摆脱这个“缺陷”,即便强大如 Visual Studio Code。开发决策没有绝对的对错,只是不同的团队做出的不同的选择。

今年,Effie 已经实现了全平台覆盖(除了 Andriod 版还没有支持思维导图),也增加了全平台的图片支持,已经是一个成熟可用的,体验绝佳的写作、笔记、思维导图 App。

Effie 既然“任性”地选择了原生,作为 Effie 的开发者,我会尽可能让 Effie 永远保持这份“丝滑”。

Effie | 6 个评论 | 3,868 次阅读
简短地址:http://ncblog.net/1954/
Effie for Android    @ 2022-10-08, 18:24

前所未有的艰难,近两年写的第四个平台的编辑器,终于完成了。

Effie | 1 个评论 | 4,949 次阅读
简短地址:http://ncblog.net/1946/
Effie v2    @ 2022-04-27, 22:47

封控在家已近一个月,开发效率多少受到点影响。不觉已春深,物我两相忘。

Effie v2.0 还是完成了,多平台(iOS/iPadOS/macOS/Windows)原生开发完美支持图片。暂时还不能说“全平台”,因为还差一个 Android,以及 Linux?

Effie | 评论已关闭 | 2,402 次阅读
简短地址:http://ncblog.net/1904/
实地“视察”五角场苹果店    @ 2022-02-23, 21:00

iPad 演示设备上都预装了 Effie 演示版。

Effie | 1 个评论 | 2,830 次阅读
简短地址:http://ncblog.net/1888/
Effie 登陆 Apple Store 零售店    @ 2022-02-22, 21:09
Effie | 评论已关闭 | 2,080 次阅读
简短地址:http://ncblog.net/1885/
Windows 版 Effie 的一个小测试    @ 2021-09-30, 14:14

试着将《三国演义》整部小说大纲化,每个段落作为一个列表项,一共2617项。在 Effie for Windows 中生成思维导图,看看原生程序的性能:

Effie 整个过程中占用内存不超过50M(作为对比,XMind 占用大约2G左右的内存)。滚动过程中 Effie for Windows完全跟手不卡顿,切换风格2秒内完成。

Effie | 1 个评论 | 3,338 次阅读
简短地址:http://ncblog.net/1845/