#1 - 2021-7-21 00:39
花生Peadar (花生?花生!)
一天补完了这部番,感觉不够过瘾,于是来这里写点东西

长篇大论预警!本文主要包含:

1. 人工智能现状
2. 本番中的合理与不合理之处
3. 为什么我喜欢人工智能

非专业文章,各位看个乐就行,别太认真

---

一、人工智能现状

简单来说,就是八字都没一撇

复杂点说,距离番中自主AI的这种,现在发展AI和番中的完全不是一个方向。因此,在可见的未来中,没有任何东西

就类似于,让你想象 iPhone 20 可能你还有头绪,但是让你想象 iSuger 20 (苹果公司推出的第20代调理品-糖)将会是一点头绪都没有。因为Apple公司压根就没做什么厨房调理品。。。AI也是一样,现在的AI压根就和番中的不是一个方向

不知道之前是谁开始传的谣言,说AI已经达到了5岁小孩的地步。曾经的我信以为真,直到。。。

现在的AI是怎样的?

本人非专业AI程序猿,只是在前百度AI部门(小度系列)打过工,接触了很多做策略的同事,也写了几个简单的策略

简单来说,对话全靠文本匹配,逻辑全靠统计学

先简单介绍下小度系列,这个系列最出名的就是“小度音箱”,类似于“小爱同学”、“天猫精灵”的产品,是一种智能音箱。你能和它对话,然后它可以帮你完成一些工作(问知识、订脑中、查天气之类的)

在我就职AI部门前,我以为的人工智能:
- 理解我在说什么,人工智能
- 找到我想要的答案,人工智能

而实际,上面都是虚假的人工智能。。。我发现真正的人工智能是指:
- 把你发的语音转成文字,人工智能
- 配配参数,找之前用户发过的10w条文本,试试识别是不是变好了,人工智能

而AI理解文本的方式有好多种,小度系列用的是最简单粗暴的——文本匹配。比如要理解你关闭某个页面的“意思”,那么文本解析大概是这样的:
1. 去掉所有语气词,比如吧、呢
2. 匹配公式【关闭 or 返回 or 退出】+【页面 or 这个 or 程序 or 网页】
3. 匹配成功,就关闭页面,匹配不成功,就换个公式。。。

事实就是这样。。。我写了几条策略后,我对AI所有的幻想碎了一地。百度成为了我的“前司”

---

二、本番中的合理与不合理之处

番里面很多东西其实是经得起推敲的,外行可能会觉得不太合理,但是实际上合理的不行,比如:

1. AI完全履行使命,没啥其他想法
是的,程序就是完全100%结果导向,哪怕现在有什么机器学习会自动的生成一些逻辑,但是完全也是结果导向
设定AI去下围棋,那么它就是会下围棋,有可能下的好有可能不太行。但是绝对不会去下象棋。。。

2. 薇薇被放在博物馆,看上去失去了自由,但是完全没有什么不满
AI的本质是程序+数据,而程序只要连了网,那么其实就是自由的,哪哪都能去。对于程序来说,【实际上去了一次巴黎旅游】,和你【直接把去巴黎旅游的数据导入】,二者是没有区别的,最终都是变成了数据

3. 逻辑炸弹、黑入
是可能做到的。尤其是有物理接触,甚至是近距离的时的黑入都是可能的。现实中就有一些通过电磁辐射读对方数据,或者打掉对方内存条里数据实现黑入的例子。。。当然不太常见,但是确实是可行的

当然也有一些不太合理的点,比如:
1. AI对于【清除记忆】这件事反应稀松平常
简直就像重启一样自然。尤其是结尾Happy End中,女主被清除数据。对于计算机来说,计算机模型是以存储程序为核心的,清除数据和死亡没什么区别,性格什么的也不会被保留

2. 旧型号作为姐姐,关爱新型号的妹妹
这个超级违和。RTX1080 和 RTX2080 哪个好?谁立场更高些?
一个东西有新型号,新版本,就是因为旧的不好才出现的,尤其是硬件,是因为旧的实在是太差了,没办法通过“升级”来满足需求,只能重新造一个

---

三、 为什么我喜欢人工智能

或许是因为程序太过于简单和纯粹,也或许是因为人性太过于暗黑和复杂

经历了无数的事情,对于人性失望,无法接受某些“常识”而融入社交,会迷上AI、虚拟偶像,是很正常的

我的常用头像(现在这个),就是一个讲述AI得到“心”前后变化的歌曲MV截图。我被其中简单、纯粹、不会背叛、永远陪伴的AI所感动,于是基本上所有的社交媒体都是这个头像

所以我曾经特别渴望去写一个属于自己的人工智能,自己正好也是程序猿。有一个AI陪伴自己,说不定也不错。。。

可惜遗憾的是,喜欢AI人工智能的各位,我们此生是没有办法见到这样的AI了。努力的在这个社会继续挣扎生存下去吧

End

---

非专业文章,各位看个乐就行,别太认真

作者的个人主页 http://pea3nut.info/
#2 - 2021-7-21 01:14
(如果努力的尽头是奇迹)
我觉得你说的这些经得起推敲的地方完全经不起推敲诶(bgm38)
明明前面说并不是一个发展方向,后面就拿现在的AI来举例,而Vivy本片和你的说法简直异曲同工,我要用这个设定时它就是绝对的,我不用那就随便,这一点也不科幻
#2-1 - 2021-7-21 09:14
花生Peadar
后面举例其实是站在程序的角度,而不是站在AI的角度。程序都是这样的
#2-2 - 2021-7-21 10:25
本楚
花生Peadar 说: 后面举例其实是站在程序的角度,而不是站在AI的角度。程序都是这样的
这片子最大的问题就是压根不懂程序,无法复制的设定直接否决了所有已知的计算机科学(bgm38)
#2-3 - 2021-7-22 09:13
花生Peadar
本楚 说: 这片子最大的问题就是压根不懂程序,无法复制的设定直接否决了所有已知的计算机科学
这个其实还好的,不可复制其实是可以设计出来的。比如说QQ号就被设计为不可复制的,不可能存在2个相同的QQ号,而程序也可以设计为根据QQ号的数字来觉得AI性格。那么在此设计下,每个QQ号都是不可复制的
#2-4 - 2021-7-22 09:18
本楚
花生Peadar 说: 这个其实还好的,不可复制其实是可以设计出来的。比如说QQ号就被设计为不可复制的,不可能存在2个相同的QQ号,而程序也可以设计为根据QQ号的数字来觉得AI性格。那么在此设计下,每个QQ号都是不可复制的
这是两回事……设计AI的人不知道AI不可复制,这是异常奇怪的地方,换句话说这个机制是自发产生的,而人类连这个都没搞明白就大规模使用了这种装俩数据库就能屠杀人类的东西,反正各种意义上不对劲
#2-5 - 2021-7-22 09:31
lhb5883-吹冈王♛⑩
本楚 说: 这片子最大的问题就是压根不懂程序,无法复制的设定直接否决了所有已知的计算机科学
自学炼丹的路过其实也可以解释,炼丹得时候很多中间数据都丢掉了,所以没法炼两次同样的丹,如果是炼好的丹(模型)可以复制,但是如果模型规模过大,中间的状态没法全部确定(比如复制的过程中发生了变化,华哥的角色应该是动态炼丹的,随着输入模型是不断变化的,甚至你的复制可能也是一个输入),那就没法无损复制了。
#2-6 - 2021-7-22 09:32
lhb5883-吹冈王♛⑩
本楚 说: 这是两回事……设计AI的人不知道AI不可复制,这是异常奇怪的地方,换句话说这个机制是自发产生的,而人类连这个都没搞明白就大规模使用了这种装俩数据库就能屠杀人类的东西,反正各种意义上不对劲
所以马斯克现在一直再说要警惕AI啊
#2-7 - 2021-7-22 09:32
花生Peadar
本楚 说: 这是两回事……设计AI的人不知道AI不可复制,这是异常奇怪的地方,换句话说这个机制是自发产生的,而人类连这个都没搞明白就大规模使用了这种装俩数据库就能屠杀人类的东西,反正各种意义上不对劲
程序大了,不管是创始人还是设计人,对于程序不了解是正常的。一开始可能还是白盒,但是慢慢的随着程序迭代变复杂,程序对大家就都是黑盒了,没有人知道程序到底是怎样完整运作的
#2-8 - 2021-7-22 10:45
卢迪乌斯
本楚 说: 这片子最大的问题就是压根不懂程序,无法复制的设定直接否决了所有已知的计算机科学
量子计算机数据就难以复制吧
#2-9 - 2021-7-23 10:11
Retorm
lhb5883-吹冈王♛⑩ 说: 自学炼丹的路过其实也可以解释,炼丹得时候很多中间数据都丢掉了,所以没法炼两次同样的丹,如果是炼好的丹(模型)可以复制,但是如果模型规模过大,中间的状态没法全部确定(比如复制的过程中发生了变化,华哥的角...
直接设个随机种子不就练出来一样的了(bgm38)
#2-10 - 2021-7-23 19:13
lhb5883-吹冈王♛⑩
Retorm 说: 直接设个随机种子不就练出来一样的了
问题就是炼丹就是要大量随机才能炼出来(bgm38)
#2-11 - 2021-7-25 20:34
epix
lhb5883-吹冈王♛⑩ 说: 自学炼丹的路过其实也可以解释,炼丹得时候很多中间数据都丢掉了,所以没法炼两次同样的丹,如果是炼好的丹(模型)可以复制,但是如果模型规模过大,中间的状态没法全部确定(比如复制的过程中发生了变化,华哥的角...
不能关机序列化下来的模型真是太屑了hhh
#2-12 - 2021-7-25 20:46
lhb5883-吹冈王♛⑩
epix 说: 不能关机序列化下来的模型真是太屑了hhh
问就是量子炼丹
#3 - 2021-7-22 09:36
(BGMのTrinitas<=>婊冈妈<=>补冈妈<=>拜冈妈 ... ...)
我倒觉得不是完全不可能,甚至如果假设是量子AI,很多设定就更合理了,无法复制可以解释为大规模采样时会发生退相干。还比如利用量子干涉达成超光速现象。或者比如逆因果。
#3-1 - 2021-7-22 11:00
书蠹诗魔LHQ
大众为什么对量子力学有这么多美好的期许呢(bgm38)量子干涉既不能超光速也不能逆因果啊
#3-2 - 2021-7-22 12:01
lhb5883-吹冈王♛⑩
书蠹诗魔LHQ 说: 大众为什么对量子力学有这么多美好的期许呢量子干涉既不能超光速也不能逆因果啊
所以才有动画啊,科幻片加入一些浪漫的幻想いいじゃないか(bgm39)
#3-3 - 2021-7-22 12:06
lhb5883-吹冈王♛⑩
书蠹诗魔LHQ 说: 大众为什么对量子力学有这么多美好的期许呢量子干涉既不能超光速也不能逆因果啊
不传递信息的现象是可以超光速的,比如旋转手电筒产生的光柱。
延迟选择实验感觉可以说是逆因果了。
稍微夸张一下作为艺术作品我觉得还好。
#3-4 - 2021-7-22 12:46
书蠹诗魔LHQ
lhb5883-吹冈王♛⑩ 说: 不传递信息的现象是可以超光速的,比如旋转手电筒产生的光柱。
延迟选择实验感觉可以说是逆因果了。
稍微夸张一下作为艺术作品我觉得还好。
问题不传递信息的超光速没啥利用价值啊(bgm38)
自媒体小编的话就不要当真了,电子的波函数是弥散在全空间的,“同时通过两条狭缝”本来就是一种不准确的说法,实际上不进行观测的话连电子到底在哪都不知道。。。
#3-5 - 2021-7-22 14:01
lhb5883-吹冈王♛⑩
书蠹诗魔LHQ 说: 问题不传递信息的超光速没啥利用价值啊
自媒体小编的话就不要当真了,电子的波函数是弥散在全空间的,“同时通过两条狭缝”本来就是一种不准确的说法,实际上不进行观测的话连电子到底在哪都不知道。。。
所以是科幻嘛 修改一下物理定律不是日常操作
#3-6 - 2021-7-22 16:23
书蠹诗魔LHQ
lhb5883-吹冈王♛⑩ 说: 所以是科幻嘛 修改一下物理定律不是日常操作
但我感觉杀猪的对AI的理解没有超过头条新闻和好莱坞大片(bgm38) 所以在这讨论Vivy里ai的设定就比较像自嗨了(bgm38)
#3-7 - 2021-7-22 17:24
lhb5883-吹冈王♛⑩
书蠹诗魔LHQ 说: 但我感觉杀猪的对AI的理解没有超过头条新闻和好莱坞大片 所以在这讨论Vivy里ai的设定就比较像自嗨了
你要是按照杨振宁的思路我们所在宇宙可能是虚拟的(bgm38)那很多穿越片就能解释了
#4 - 2021-7-22 11:57
(有期望,有力量。)
说句题外话,1080前缀是GTX,RTX是可以开光线追踪的,10系卡没这资格(bgm38)
不过人工智能不应该用A100那样的计算卡吗,用这种普通卡算力可够啊。有可能是成本问题,但搞这个不砸点钱没什么效果吧。
#4-1 - 2021-7-23 09:56
Retorm
够的,我们组就是1080Ti,2080Ti,3080,V100都在用的(bgm38)
其实算力对于大多数任务不是一个大问题,毕竟基本是时间成本线性增加,真正的问题是显存,不够的话只能减少参数量降低模型性能,这个时候32g的V100就很牛皮了(bgm38)
#4-2 - 2021-7-23 10:05
小男孩
Retorm 说: 够的,我们组就是1080Ti,2080Ti,3080,V100都在用的
其实算力对于大多数任务不是一个大问题,毕竟基本是时间成本线性增加,真正的问题是显存,不够的话只能减少参数量降低模型性能,这个时候...
NV给显存一直都比较抠的说。
#4-3 - 2021-7-23 10:08
Retorm
小男孩 说: NV给显存一直都比较抠的说。
没办法,AMD连cuda都用不了,只能加钱买老黄显存更大的玩意(bgm38)
#5 - 2021-7-22 12:46
(比希望更炽热,比绝望更深邃。)
看到标题就想吐槽了,结果进来也确实看到楼主吐槽了,根本就不是一个东西嘛。
别太看得起那个砍肉的了,他肯定不懂的(bgm38)
#6 - 2021-7-22 20:19
想看看楼主对beatless的想法,也是ai科幻的主题
#7 - 2021-7-23 10:02
(Rigidity and Uncertainty~☆)
现在我们讨论的ML都是基于已知的ANN结构,或许未来的神经网络架构足以支持自我意识的诞生也不一定
#7-1 - 2021-7-23 11:05
#1F1E33
deepmind不是说Reward is enough吗(bgm38)
#7-2 - 2021-7-23 11:31
th3ta "Paradox"
#1F1E33 说: deepmind不是说Reward is enough吗
感觉出了那篇 attention 之后这种类似于 xxx is all you need 的标题特别流行...
另外,提到 reward 就想起来那个玩游戏选择自杀的AI小机灵鬼了(bgm38)
#8 - 2021-7-23 14:38
(B站难民)
AI 感觉是一种滥用,很少能在论文标题里直接能看到包含AI的,大部分都是用的DL(deep learning), RNN,GAN等模型在标题里。
楼主也不用对现在的AI太失望,虽然没法给死宅每人发个老婆,但是有很多有用的领域,比如蛋白质结构预测,帮助量子化学做偏微分方程求导等。有兴趣的话,建议找个公开课试试。
#8-1 - 2021-7-23 16:37
书蠹诗魔LHQ
直接带AI的一般都是骗经费的吧(bgm38)
#8-2 - 2021-7-23 16:50
#1F1E33
做protein folding的人已经被deepmind干傻了, alphafold2还是太猛了
#8-3 - 2021-7-23 19:14
lhb5883-吹冈王♛⑩
#1F1E33 说: 做protein folding的人已经被deepmind干傻了, alphafold2还是太猛了
还是数据量积累到了
#9 - 2021-7-23 19:19
(Sasasu)
你所在的部门是 AI 变现部门,需要的是稳定的用户体验和销量,用模型带来和审查风险远大于用人类写策略产生的开销。

你所说的策略实际上是规范化人类表达方式便于机器理解,里面有逻辑也是因为策略的可解释性好于炼丹。

实际上专门用来聊天的 AI 已经能当一个很好的跑团城主和色情游戏导演

我认为比起说 AI 架空太多还不如说时空穿越是不可能的,作者只想拿经常用的题材做个动画而已。
#9-1 - 2021-7-23 22:15
花生Peadar
其实时空穿梭还挺靠谱的,虽然这方面其实我们人类没啥进展,但是也可以换句话说是未来可期
#9-2 - 2021-7-24 00:01
书蠹诗魔LHQ
花生Peadar 说: 其实时空穿梭还挺靠谱的,虽然这方面其实我们人类没啥进展,但是也可以换句话说是未来可期
AI比时空穿梭靠谱多了吧(bgm38)时空穿梭都未来可期了ai不更是未来一片光明
#10 - 2021-7-24 01:15
(…………)
这个片子的所谓AI难道不就是一种新人类吗(bgm38)
只是硬件都很像机器罢了
#10-1 - 2021-7-25 13:12
花生Peadar
其实反抗军们他们才是AI?(狗头
#10-2 - 2021-7-26 00:28
invisible
这片子把AI换成人造人之类的名词 就合理多了
#11 - 2021-7-25 00:35
(信仰是为了虚幻之人)
什么时候AI能理解而非学会了某种技能和概念,那人类或许也能明白大脑究竟是如何思考的,否则,如今绝大多数文艺作品中的“AI”都只是幻想,如今强人工智能确实是八字没有一撇的
#12 - 2021-7-26 13:09
(姐姐最会做肉派了,DUFUFU~)
“对话全靠文本匹配,逻辑全靠统计学” WTF


那这真是挺拉的。百度应该是国内AI做的最好的了,但是如果只是这种10年前就早已经有应用的加强版聊天机器人的话那是真的不行
#12-1 - 2021-7-27 00:47
花生Peadar
所以当时我很绝望,对AI是所有幻想万念俱灰
#12-2 - 2021-7-27 12:54
invisible
AI领域最火的自动驾驶也是各种规则吧
#12-3 - 2021-7-27 21:16
Sasasu
国内 AI 要求表现稳定,不能被查水表和色情。所以炼丹意义上的 AI 都在图像识别,广告分类上。和人类交互的都是策略。

国外 AI 就开放很多,Google 的翻译 AI 把日语的「放送」翻译成中文的「分娩」也一直没人管。
#13 - 2021-7-27 11:26
(あなたが、私の夢だ)
当能够发泄情绪的时候就说明幻想还没破灭

当下99%的人工智能都只是停留在模式识别及其延伸上的,这点在进大学选专业之前就应该有所了解

至于后面的一些违和的逻辑问题,确实是因为人与机器的立场不一样造成的
#14 - 2021-7-27 11:37
(动漫咸鱼,游戏废人)
这种写前公司产品逻辑分析的还是小心点,不要被律师找麻烦(bgm38)
#15 - 2021-7-27 11:48
5,6年前听过一个讲座,大意是:人类理解语言是从逻辑到抽象的过程,用语言表达则相反,计算机很难做到这一点(图灵测试)。所以翻译软件的水平是反映当代ai技术的一个标准。不知道有没有道理,现在还是否适用。
#16 - 2021-7-27 17:07
这个理解的角度很有意思,尤其是那个比喻。
受限于我个人的阅历,我个人的理解,大部分的说什么机器人、AI之类的故事,
都是在借着机器人、AI的硬件脱离,也就是从人的物理硬件/肉体、人脑,提纯出的性格、经历、感情这些真的可以被抽象出来的"数据" 、"灵魂",然后去讨论什么是爱,什么是自我,什么是希望和痛苦,什么是生命和生存,这些比较抽象的事情了。从而去在不怎么人类的存在中寻找非常人性的东西。

VV的AI我就完全当成机器人美少女,百年旅程还挺浪漫的,尤其是倒数第二集,看着认识的博士从小孩到生儿育女,有种脱离于人类世界的异样经历。不过一般我不怎么喜欢机器人美少女的设定(因为不好GHS)

现实中的AI,我个人觉得最大的意义还是从繁复而琐碎的操作中,解脱人类的生产力,让人类的创造力能到达新的境界。我最感兴趣的AI方面果然还是很在数字艺术的运用上,尤其是动画、绘画方向的。
#17 - 2021-7-27 22:36
看到这些就感觉感觉出生的太早了
#18 - 2021-7-27 23:00
这些可以公开说吗?(bgm38)
不过楼主这么一说我也挺幻灭的,同时也不担心文艺作品里那些人工智能危机了(bgm99)
#19 - 2021-7-28 23:21
常春藤AI专业工科硕士,现HVV无线AI核心部门工程师,觉得你说得片面了,文本匹配和统计学,基于数学公式的输出,严格意义上完全称不上是AI,由于在处理大数据上效率非常高,而且在很多任务上的表现还可以,所以才被广泛应用。
AI的本质并不是数据+规则,在这两个之间,真正的AI还有学习的过程,通过输入的数据改变自我,这往往是你在白盒匹配和统计中看不到的。
简单来说,目前的一个AI需要有数据+模型框架(深度学习,ensemble模型等等)+目标(target,损失函数),其实也能理解成一种最优化的过程,让机器自助地在这个框架里面改变,使其输入数据的输出能够尽可能达到目标(损失函数最小),这里面学习的过程很重要。
在未来的事情有无限可能,并不一定不会出现AGI,当然这或许是一件很恐怖的事情。
#20 - 2021-7-29 20:35
([s]安静点格子[/s] ☄️??⚓ ?)
我觉得一部好的关于人工智能的作品,关键不在人工智能的方式多么符合现实,而是从人工智能中映射出的我们自身的人性,仿生人也是同理。
#21 - 2021-7-30 16:00
与其实说是人工智能,不如说是人造意识,而意识到底是什么,我觉得就目前科学而言还无法解释清楚;加上人的记忆相对AI是不精准的,常有取舍,容易错误的,但这却可能是人类意识的基石。这个对AI而言需要模拟可能因为各种因素而产生的莫名bug,难点可能不是太复杂,而是无意义。
#22 - 2021-7-30 16:58
(诶嘿☆)
只可惜欧盟的人类大脑计划基本歇菜了(bgm38)(bgm38)
#23 - 2021-7-31 09:49
(樱舞落花恋模样 恋花绽放樱飞时)
而实际,上面都是虚假的人工智能。。。我发现真正的人工智能是指:
- 把你发的语音转成文字,人工智能
- 配配参数,找之前用户发过的10w条文本,试试识别是不是变好了,人工智能

而AI理解文本的方式有好多种,小度系列用的是最简单粗暴的——文本匹配。比如要理解你关闭某个页面的“意思”,那么文本解析大概是这样的:
1. 去掉所有语气词,比如吧、呢
2. 匹配公式【关闭 or 返回 or 退出】+【页面 or 这个 or 程序 or 网页】
3. 匹配成功,就关闭页面,匹配不成功,就换个公式。。。
有没有可能,人脑的工作方式其实也是这样的