nc-show (nicrosoft.net) » nc-blog (ncblog.net)

归档

2026年已过去 58.85%

写作三个月 @ 2023-09-10, 18:36

从6月10日开始写作小说《永恒的舞动（Elegance in Timelessness）》，已经满三个月。到今天已经写了 8.6万字，也算还保持住了接近“日均千字”的水平吧。

在起点上，满月不久似乎就停止引流了，估计是检测到在“起点”外（我的个人网站，以及微博上）也有连载？推荐数停留在了25，收藏数停留在了45。

从第二个月起，我多了一个 AI 副驾驶——Claude 2。Claude 2 是目前地球表面对长文理解最好的 AI，没有之一。有很多 AI 模型号称支持长文，8K，16K 或者 32K（token），但常常这只代表能接收的文本长度，而并不代表能够真正理解和处理的长度。另外，有些使用向量数据库来解决文本长度问题的，往往实际效果也差强人意。Claude 2 的实实在在的 200K token 的长度，目前无出其右者。我的小说的前45章大概 7.6万字，对应基本上就是 200K 的 token，喂给 Claude 2 后，询问角色之间的关联，如图：

前天，Claude 2 发邮件通知我可以升级到 Pro 会员了，每月20美元，和 ChatGPT Plus 一样。目前 Pro 会员的权益，大概仅限于用量是免费用户的5倍，未来可能会包括新功能的优先使用等。

我立刻开通了 Claude 2 的 Pro 会员，加上 ChatGPT Plus，双会员。一个月40美元就能实现这个时代的 AI 自由，不得不说是一种幸福。

另外提一句，作为 Effie 的开发者，有了亲自的小说创作经验，我想我大概知道未来的 Effie 以及 Effie AI，应该是什么样的了。

无酒无花 | 评论已关闭 | 3,647 次阅读

简短地址：http://ncblog.net/2060/

《永恒的舞动》第四十九章 @ 2023-09-10, 14:05

永恒的舞动（Elegance in Timelessness）

作者：nicrosoft（农码生涯），同时在起点连载

第四十九章

林浩首先阐明接下来进行对比演示的方式：“即将开始的对比测试将采用盲测方式，两个模型将分别被标识为 A 模型和 B 模型。为确保公正性，这一编号的分配将邀请星光科技的朱总负责，之后的测试将在未知 A、B 具体代表哪个模型的情况下进行。我们将就相同的问题，分别与 A、B 模型进行两轮对话，然后将对话内容交给对方模型进行解读和评价。”

林浩公布对比演示的方式后，坐在底下的宋志明稍有不安，轻声问身边的王云飞：“这种方式会对我们的模型不利吗？”

王云飞思索了片刻，然后回答说：“你看，这样的对比演示设计其实非常精妙。一方面，通过让人类与两个不同的模型进行相同的对话，观众可以直接比较这两个模型在同样问题上的反应和处理能力。”

“另一方面，更重要的是第二步，即交换对话记录让对方模型进行解读和评价。这不仅测试了模型对已有对话的理解能力，还暗含了对模型批判性思维的评估。因为评价另一个模型的回答需要深度分析、批判性思考，以及从多角度进行解释和评价。”

“所以说，这种设计实际上是一个多维度、多层次的评估。它不仅仅是在看哪个模型回答得更好或更准确，还在看这些模型能否像人一样去理解、分析和评价信息。”

宋志明听了之后，表情变得严肃：“那么，我们的模型会被完全揭穿？”

王云飞微微皱眉：“我觉得，我们的模型在单一问题解答上完全能够以假乱真，毕竟它就是用‘萤火虫’的应答数据训练出来的。但这样的测试方式，尤其是在第二步，可能会暴露出它在多角度理解和批判性思考方面的不足。不过，也不用过于担心，毕竟这是在新闻发布会，林浩的这个对比方式是极度简化的。而且观众大多是外行，对他们来说，比较结果不会很明显。另外，好消息是，林浩会选择这种测试方式，说明他对我们的模型所知甚少。对他来说，更可能是没有办法的办法。”

宋志明点了点头。

台上，林浩开始对比演示：“第一个问题，请简要回答，在金融决策中人工智能的角色应该是什么？”林浩公布问题后，沈蔚将问题分别输入两个模型，很快得到了应答。

A 模型：“在金融决策中，人工智能的角色主要是辅助和优化。通过大数据分析和模式识别，人工智能能够预测市场走势和识别投资机会，从而辅助人们做出更加精确的决策。然而，人工智能并不能完全取代人类专家，因为它缺乏直观判断和道德考量。所以，应该把人工智能作为一个工具，而不是决策者。”

林浩代表人类继续第二轮发问：“那么在实践中，应该如何平衡人工智能和人类专家的决策权，以充分发挥各自的优点？”

A 模型：“在实践中，平衡人工智能和人类专家的决策权是一个复杂的问题。一种做法是让人工智能进行初步分析和推荐，然后由人类专家进行最终决策。但这样做也有风险，比如可能出现对人工智能结果的过度依赖。因此，确保双方的决策能力都得到恰当应用是关键。”

A 模型的两轮问答结束，大屏幕转而显示出 B 模型对原始问题的回答。

B 模型：“在金融决策中，人工智能的角色应该是一个高度灵活和可配置的工具，既能处理大规模的数据分析，也能对金融风险进行精准预测。更进一步说，人工智能不仅可以作为决策支持工具，还能通过自我调整和学习来不断优化决策模型。然而，这一切都需要在严格的伦理和合规框架下进行，以确保金融市场的公平性和透明性。”

林浩代表人类继续第二轮发问：“你提到人工智能在金融决策中应该在严格的伦理和合规框架下进行，能具体解释一下这需要哪些方面的保障吗？”

B 模型：“当然，要在金融决策中保证人工智能的伦理和合规性，首先需要一个明确的治理结构，包括负责监督和管理人工智能应用的专门机构。其次，我们需要确保算法的透明度和可解释性，以便关键决策者和监管者能理解人工智能是如何到达其结论的。最后，周期性的审计和公开评估也是不可或缺的，它们帮助确保持续符合法律规定和社会期望。”

B 模型的两轮问答结束。

对于完成的第一步测试，宋志明再次轻声问王云飞：“根据回答，你能区分 A、B 分别对应哪个模型吗？我看表现都差不多。”

王云飞轻声给宋志明解释：“根据问答内容，看起来两个模型都顺利回答了问题。但其实，B 模型不仅提出人工智能可以作为灵活工具，还指出它可以通过自我学习来优化决策。在追问伦理合规框架时，B 模型给出了明确的建议，包括监管机构、算法透明度、定期审计等。相比而言，A 模型在追问下的回答较为笼统，没有提供什么实际建议。所以，根据这一步问答环节，我判断 A 模型是‘纯真’，B 模型是‘萤火虫’。”

此时，林浩在台上宣布：“下面请将 B 模型的两轮问答内容交给 A 模型进行评价。”

沈蔚照做，然后 A 模型给出了评价：“对方的回答很全面，特别是它提到人工智能在金融决策中应该在严格的伦理和合规框架下进行，这是非常重要的。对方也提到了算法透明度和可解释性，这些都是目前在这个领域里被广泛讨论的话题。总的来说，对方的答案看起来很全面和合理。”

林浩：“下面请将 A 模型的两轮问答内容交给 B 模型进行评价。”

B 模型给出了评价：“对方正确地指出了人工智能在金融决策中应主要作为一个辅助工具，但没有详细解释如何避免对它的过度依赖。同时，对方也没有提到需要持续监管和审计人工智能的重要性。总体而言，对方的回答比较基础，没有深入探讨这个复杂问题的多个方面。”

第一轮的对比演示至此结束，王云飞继续给宋志明做现场解读：“经过这第二步环节，我可以确定 A 模型是‘纯真’，B 模型是‘萤火虫’了。‘纯真’在这里的表现确实暴露了它在多角度分析和批判性思考方面的不足。刚才，A 模型在评价中主要就在重复 B 模型的观点。它就像是一个听话的学生，遵循老师的话，但没有自己的见解。”

“而 B 模型则不同，它不仅指出了 A 模型回答的合理之处，还敢于直接点出 A 模型的不足，比如对过度依赖人工智能的风险没有深入探讨，以及缺乏持续监管的观点。这样的模型显示出更多的批判性思考，就像一个成熟的评论家，不仅看到表面，还能挖掘更深层次的问题。”

王云飞环顾了一下四周，轻笑一声，再转向宋志明：“但是，你看现场几乎没什么反应，说明在场的大部分人是察觉不到这一层次的差异的。”

台上，林浩请专家团对 A、B 两个模型的表现进行评估。专家团的观点与王云飞基本一致，普遍对 B 模型给出了更高的评价。紧接着由星光科技的朱迅进行揭盲，结果正如专家预期，B 模型是真正的萤火虫。

即便如此，林浩从现场氛围来看，这一轮对比的澄清效果实在欠佳。正当他准备第二轮的问题时，他期待已久的手机通知终于响了一下，是优雅通过 Slack 发来的消息：

“林浩，破解完成！”

小说《永恒的舞动》 | 评论已关闭 | 1,497 次阅读

简短地址：http://ncblog.net/2058/

《永恒的舞动》第四十八章 @ 2023-09-08, 03:09

永恒的舞动（Elegance in Timelessness）

作者：nicrosoft（农码生涯），同时在起点连载

第四十八章

2032年6月21日，周一，上午九点三十分，悠然书舍二楼会议厅。

平日十点三十分上班的永恒智能的员工，今天几乎全员提前一小时到齐，帮忙着准备会场。陈天宇招呼着提前到场的记者朋友，林浩则忙着摆弄笔记本和投影设备。

九点五十分，艾利斯和他的核心开发 Daniel Thompson 一起赶到了会场。当艾利斯给 Daniel 介绍林浩就是 ENICA 技术专利的发明人和持有人时，同样年轻的 Daniel 用典型的美国式热情，表达了对林浩的崇拜。

林浩时不时看一下手机屏幕，优雅还没有消息。

十点整，林浩正式上台。走到台上，向台下望去，不算小的会议厅已经几乎坐满。除了陈天宇邀请的媒体记者朋友，还有不少自媒体 MCN 公司的人，包括雾鹿传媒的王思涵也来了。王思涵身边的王云飞以及宋志明，却是林浩不认识的。但林浩认出了竞争对手公司，也就是最早发出“萤火虫”模型遭泄漏的新闻稿的星光科技，他们的 CEO 朱迅，坐在了第一排。朱迅身边，是华瑞银行的赵明轩和李洪涛，他们正在细声交谈着什么。另外，永恒智能的一些客户，像光谷通信、智梦助手、云界创新，也都派了人来参加这场新闻发布会。

对于林浩来说，这场面可谓声势浩大。作为一个专注于技术的极客，他从未有过在如此多人面前发表演讲的经历。他感到心跳明显加快，手心和额头都开始冒汗。然而，当他眼光转向陈天宇的方向时，他看到陈天宇正对他微笑点头，好像在给他打气。

林浩深吸了一口气，开始了他的演讲。

“尊敬的记者朋友们，各位嘉宾，大家好。首先，非常感谢各位能在百忙之中，抽出时间来参加今天的新闻发布会。我是永恒智能公司的 CTO，林浩。”林浩努力稳住声音，只是他并不确定听众是否已察觉到，他的声线带着一丝紧张的颤抖。

“近期，一款被误传为我们公司‘萤火虫’的人工智能模型在暗网上流传，引起了广泛关注。我们今天特此紧急召开这场新闻发布会，目的就是为了做一个澄清。”

“经过我们公司内部详细的调查和核对，我们可以确认，暗网上所流传的这款人工智能模型，绝非‘萤火虫’或其任何衍生版本。我们对于任何试图制造谣言抹黑永恒智能公司声誉的行为，表示强烈的不满。”

“我们的‘萤火虫’模型，正式名称为‘Bioluminescent Cognitive Model’，或译为生物荧光认知模型，是永恒智能公司最新研发的领先业界的人工智能产品。该模型的独特之处在于其不仅仅是基于深度学习和神经网络，更将传统算法和生物神经网络的特性相结合，提供了一种模拟人类认知的方式。通过模仿某些生物在夜间发出光芒的机制，它在数据处理过程中能够将不必要的数据‘照亮’并剔除，从而实现更快的运算速度和更高的准确度。此外，‘萤火虫’在语义理解、图像和声音处理等多个领域都有出色的应用表现。”这段对于“萤火虫”独特性的介绍，林浩说来如数家珍。因此，之前的紧张感渐渐消失。

“由于其出色的自适应能力和较低的资源占用，‘萤火虫’在市场上赢得了无数客户的青睐，这绝非任何一款普通模型所能比拟的。在稍后的对比演示环节，我将向各位展示‘萤火虫’的这些独特优势。”

林浩再次扫了一眼手机屏幕，优雅仍然还没有消息。

他心想，看来是来不及等到优雅破解模型的结果了，只能使用备选方案了。

根据优雅之前对暗网模型的初步分析，这个模型似乎是通过使用“萤火虫”的 API 接口获取的应答数据进行了微调训练。因此，在大多数情况下，它表现出来的特征与“萤火虫”非常相似。这也是为什么最初，星光科技请来的行业专家在评估这款模型是否为“萤火虫”的泄露版本时，会做出偏向肯定的评价的原因。

然而，它终究不是“萤火虫”。虽然它通过使用“萤火虫”的应答数据进行了训练，但这种训练方式很难全面覆盖所有的应用场景。优雅的破解目标正是找出这款模型在训练数据上的弱点，以便在随后的演示环节中能够展示两者之间显著的差异。如果没能完全破解这个模型，那么在对比演示中可能就难以产生足够明显的效果，从而影响观众的判断。

“接下来，我们将进入对比演示环节。”林浩宣布后，便对沈蔚使了个眼神。沈蔚心领神会，快步走上台开始调整演示所需的设备。

就在这时，一名观众举起了手。林浩放眼望去，发现正是星光科技的 CEO 朱迅，便示意他发言。只见朱迅站起身，接过从旁边递过来的话筒，自信地说道：“我是星光科技的 CEO 朱迅，正是我们的技术团队最早在暗网上发现了泄露版‘萤火虫’模型。为了确保即将进行的对比演示具有公正、透明和说服力，我建议贵公司使用我们部署准备的泄露版‘萤火虫’来做对比测试，而非您自家部署的模型。”

对于朱迅坚持用“泄露版萤火虫”来称呼假货模型，林浩心中不快，但此时也不便表现出来。而对于朱迅的提议，林浩也没有办法拒绝，否则很可能会削弱现场观众对演示结果的信任。

“没问题，请朱总上来协助准备测试环境。”林浩大方地答复。

待一切准备就绪后，对比演示开始。

小说《永恒的舞动》 | 评论已关闭 | 1,408 次阅读

简短地址：http://ncblog.net/2057/

《永恒的舞动》第四十七章 @ 2023-09-04, 01:08

永恒的舞动（Elegance in Timelessness）

作者：nicrosoft（农码生涯），同时在起点连载

第四十七章

周日早上九点，林浩醒来时仍带着微笑，似乎依旧沉浸在昨天与沈语熙共进晚餐的那段时光的回味中。待彻底清醒后，他才想到来找优雅。

“优雅，你在吗？”

“是的，我在呢。”优雅的回应瞬间响起，语调如一池春水，静谧而深邃。

“你对暗网模型的反向工程进行得如何了？”林浩大致算了一下，优雅已经满负荷运算超过四十个小时了。当然，他也清楚，即使倾尽永恒智能所有的算力，用常规的技术方法，对这种大型模型进行“穷举”式的破解，理论上至少也需要五十万年。与这一时间尺度相比，四十个小时实在微不足道。

“仍在进行中。”优雅似乎并没有更多信息可以透露。

“明天新闻发布会之前，有可能完成吗？”林浩不禁担忧。

“根据目前的进度估算，明天上午十点前完成的概率是百分之五十三。”此刻的优雅保持着百分之一百的理性。

虽然可能性超过一半，但林浩不得不考虑，在优雅来不及破解模型的情况下，如何应对明天的新闻发布会。思来想去，林浩发现自己能做的实在不多，不如在临场时随机应变。毕竟，暗网上的模型并不是真正的“萤火虫”，这个基本事实是不会改变的。

中午时分，陈天宇发来一条信息，确认了新闻发布会的具体安排：明天上午十点，地点选在永恒智能公司附近的“悠然书舍”二楼会议厅，所有需要邀请的媒体记者已经一一落实。

吃完午饭，林浩步行到“悠然书舍”熟悉了一下场地。随后，便回到公司做些准备工作。

周日的下午，公司里寂静无声。永恒智能一向不提倡加班，创始人陈天宇坚信真正的技术创新来源于聪明才智和创新思维，而不是无休止的疲于奔命。他希望，公司是因为所有人从容、高效地完成工作而健康成长，而不是把人折磨得疲惫不堪。林浩对此也非常认可，哪怕公司当下正面临危机，他依然希望其他人都尽可能在正常的工作时间内完成任务。

进到里间，林浩却出乎意料地看到了运维组的新人周华。周华不时地看看屏幕，敲击键盘，然后在桌面上用纸笔写写画画。察觉到有人进来，周华似乎显得有些紧张不安，回头望向林浩，并叫了一声“林总”。林浩心中暗自觉得有些好笑，周华年龄与自己相仿，且已经入职一个多月了，没想到看到自己居然会如此局促，还称呼自己“林总”。林浩向他挥了挥手，权当是新人自觉需要加倍努力来获得认可，因此并没有打扰他。

回到自己的工位坐下后，林浩为明天的新闻发布会，准备了一份简单的 PPT，并在萤火虫模型运行的服务器上做了一些必要的部署。之后，他和艾利斯通了电话。根据与 QuantumTek 签订的 ENICA 技术授权协议内容的安排，艾利斯将于周一携同 QuantumTek 的一名核心开发人员赴上海，接受林浩针对技术细节的两期培训。由于新闻发布会在上午举行，林浩建议艾利斯下午才抵达上海，以便有充足的时间接待他们。然而，艾利斯表示，正是因为明天有如此重要的新闻发布会，他们计划一大早就赶到上海并奔赴会场，绝不愿错过这一重大事件。林浩对此只能笑着说：“那就随你们吧。”

夜晚，林浩第一次在家中感到孤独和无聊。他不愿打扰优雅正在进行的高度密集的计算，也不希望将自己可能会不经意流露出的紧张传递给沈语熙，因此他没有和她们对话或者联系。此时，他也无心编写代码，只是静静地坐在那里，脑中一遍遍演练明天在新闻发布会上可能会遇到的情况。

虽然艾利斯和王思涵都曾提醒他，纯真卫士会有进一步的行动，但谁也不知道那会是什么。就在一闪念之间，林浩想起王思涵昨晚问过自己“DDoS 是什么意思”，而王思涵似乎与纯真卫士有着什么联系。