爱吱声

标题: T教授给我们说说吧,这东西有多厉害? [打印本页]

作者: 晨枫    时间: 2021-6-2 21:56
标题: T教授给我们说说吧,这东西有多厉害?

北京发布全球最大人工智能模型
发布 / 2021年6月2日 8:50 PM

中国首个超大规模人工智能模型“悟道2.0”,昨天在国际人工智能高端学术交流活动北京智源大会上发布,

据央视新闻报道,北京智源研究院理事长张宏江介绍,悟道2.0是世界上最大的人工智能的模型,“我们看到一系列的这个参数都在世界领先地位,也代表了中国和世界在AI上面的最新的突破,最新的发展。”

北京智源研究院学术副院长唐杰说,它可以实现很多基本的人的一些功能,比如说我们实现强人工智能中的基本的一些问题,像问题回答、作诗、作图。它可以赋能每一个传统的企业,甚至很多IT的企业,以它们智能的能力,就是它们可以在这个电力的基础上,可以实现很多电力的计算,包括其他方面的一些应用。

大会上还发布了基于该模型诞生的中国首个原创虚拟学生“华智冰”。本届北京智源大会围绕国际人工智能学术前沿和产业热点设置了“预训练模型”“机器学习”“群体智能”“AI创业”等29个专题论坛。议题范围从AI基础研究、跨界融合到产业应用,给学者、工程师、技术人员提供了一个交换和活跃想法的平台。

北京智源大会是一个国际性人工智能高端学术交流活动,定位于“AI内行顶级盛会”,2019年举办了首届大会,今年已经是第三届,6月1日至3日线上线下同步召开。

=========================

这就是比“阿尔法狗”更大的深度学习模型吗?到底有多厉害?T教授给我们说说吧。


作者: togo    时间: 2021-6-3 03:06
斯基先说说那个土鸡国无人机自主向人开枪是怎么回事吧
作者: 晨枫    时间: 2021-6-3 04:22
togo 发表于 2021-6-2 13:06
斯基先说说那个土鸡国无人机自主向人开枪是怎么回事吧

没有看到这消息啊
作者: 沉宝    时间: 2021-6-3 04:41
“阿尔法狗”即使在当时也不是最大的深度学习模型系统,它的贡献在于找到了在围棋这类智力博弈问题方面有效使用深学系统的方法。

悟道2.0的系统参数数量已超过1.75万亿。如果我们用传统的神经元网络模型来看待这个系统的话,可以想象成它拥有最多的神经元节点。有时候规模大到一定程度后会出现质的飞跃,比如智人,当他们脑容量激增(主要是大脑皮层大幅度增加),达到现代人的水平,他们的后代就走上了与地球上所有其它动物完全不同的发展道路。
作者: togo    时间: 2021-6-3 04:43
晨枫 发表于 2021-6-2 12:22
没有看到这消息啊

New York Post上的文章

https://nypost.com/2021/05/29/ki ... hout-being-told-to/

作者: 晨枫    时间: 2021-6-3 08:33
本帖最后由 晨枫 于 2021-6-2 20:22 编辑
togo 发表于 2021-6-2 14:43
New York Post上的文章

https://nypost.com/2021/05/29/ki ... -human-target-witho ...


这和“无人机自主杀人”有点不一样。土耳其这无人机的自主程度并不高,这只是遥控脱线的情况下自主,可以看成导弹发射的时候还是瞄准的,或者“发射后锁定”,但从发射到锁定的中间有一段掉线了。
作者: 伯威    时间: 2021-6-3 14:48
悟道应该走的是GPT的路数,看了下新闻,确实是拿GPT-3来比较的。GPT出来这么多年了,除了参数多,没听说解决了什么突破性的问题,可能还是时候未到吧。AlphaGo是不同路数,独辟蹊径,确实突破了。AlphaFold也不错,不知道和AlphaGo除了名字外还有什么共通之处。
纯AI门外汉,随便说说。
作者: 晨枫    时间: 2021-6-3 21:06
伯威 发表于 2021-6-3 00:48
悟道应该走的是GPT的路数,看了下新闻,确实是拿GPT-3来比较的。GPT出来这么多年了,除了参数多,没听说解 ...

虚心请教:GPT是什么?
作者: testjhy    时间: 2021-6-3 21:31
晨枫 发表于 2021-6-3 21:06
虚心请教:GPT是什么?

这是Generative Pre-Training的缩写,OpenAI提出的利用深度学习来“理解”自然语言的模型。以参数海量为特征,动辄上千万的变量,语料库现在可能用T来衡量了,所以极其消耗计算资源。吃进这么多语料后,写个诗,对个对子,问答“显得”比较“智能”。
作者: 晨枫    时间: 2021-6-3 22:00
testjhy 发表于 2021-6-3 07:31
这是Generative Pre-Training的缩写,OpenAI提出的利用深度学习来“理解”自然语言的模型。以参数海量为 ...

教授给说说,那个“悟道”到底有没有料,还是就一玩具?
作者: testjhy    时间: 2021-6-3 22:09
晨枫 发表于 2021-6-3 22:00
教授给说说,那个“悟道”到底有没有料,还是就一玩具?

原创性感觉不大,靠算力取胜。感觉GPT-3后面进展也慢下来了。我属于在边上看着GPT发展的,自己的方法与它差别很大,它是用句子之间的上下文学习来推断句子的生成,我比较在意句子中字汇的句法/语义,古典学派。
作者: 捣江湖    时间: 2021-6-5 14:58
testjhy 发表于 2021-6-3 22:09
原创性感觉不大,靠算力取胜。感觉GPT-3后面进展也慢下来了。我属于在边上看着GPT发展的,自己的方法与它 ...

借楼 问一个问题。

T教授,音色是个什么东西,或者说可以通过控制xx 来控制某声音的音色。这个xx 是什么东西,怎么提取和再次合成到 TTS 中
作者: testjhy    时间: 2021-6-5 21:39
捣江湖 发表于 2021-6-5 14:58
借楼 问一个问题。

T教授,音色是个什么东西,或者说可以通过控制xx 来控制某声音的音色。这个xx 是什么 ...

抱歉,语音不是我的研究对象,我猜测,音色可能是一组音频和音幅调和达到的效果。
作者: 机器猫    时间: 2021-6-8 07:41
捣江湖 发表于 2021-6-5 14:58
借楼 问一个问题。

T教授,音色是个什么东西,或者说可以通过控制xx 来控制某声音的音色。这个xx 是什么 ...

简单点说,一个乐器发出同一个音(比如C)的时候,音高是一样的,也就是说震动的基础频率是一样的。但是乐器发出的音并不只有基础频率,而是跟基础频率的2倍频3倍频4倍频一直到无穷倍频的叠加。而这些倍频的部分不同倍频的振幅的组合就决定了这个音的音色
作者: 包子    时间: 2021-6-8 09:19
机器猫 发表于 2021-6-8 07:41
简单点说,一个乐器发出同一个音(比如C)的时候,音高是一样的,也就是说震动的基础频率是一样的。但是 ...

简单的说,音色是由泛音决定的特征。
作者: 捣江湖    时间: 2021-6-8 09:35
本帖最后由 捣江湖 于 2021-6-8 09:37 编辑
机器猫 发表于 2021-6-8 07:41
简单点说,一个乐器发出同一个音(比如C)的时候,音高是一样的,也就是说震动的基础频率是一样的。但是 ...


[latex]p = \sum A_i[/latex]
1. 这个解释不错。

那是不是可以理解为,人不同音色是由于声带构造的不同造成的稳定的不同频率声音幅度叠加的输出。

那如果用神经网络 该如何学习编码或者模仿一个人的音色。


2. 那 更深的一个问题就是 比如 发音 a, e ,i , o, u 的发音不同,在于口型气流的不同,而不是声带振动模式的改变?



作者: 机器猫    时间: 2021-6-8 09:46
捣江湖 发表于 2021-6-8 09:35
1. 这个解释不错。

那是不是可以理解为,人不同音色是由于声带构造的不同造成的稳定的不同频率声音幅度 ...

这个问题对于我来说有点太复杂了。
我的理解是人的音色除了标准的音色定义以外,因为声带并不是一根能接近理想的弦的东西,本身连音高都不是单一的

作者: 包子    时间: 2021-6-8 18:29
捣江湖 发表于 2021-6-8 09:35
1. 这个解释不错。

那是不是可以理解为,人不同音色是由于声带构造的不同造成的稳定的不同频率声音幅度 ...

大概说一下,发声体振动产生声音,波长最长的叫基音,以基音为标准,波长通常为基音的整数分之一的音为泛音,泛音的组合决定音色,并且还能让人感觉到基音的强度。

其实吧,自然界大部分声音都带点泛音,乐器也是,吉他演奏泛音特别容易,找到基音的二分点就行。
作者: 捣江湖    时间: 2021-6-9 14:57
包子 发表于 2021-6-8 18:29
大概说一下,发声体振动产生声音,波长最长的叫基音,以基音为标准,波长通常为基音的整数分之一的音为泛 ...

妙啊。

那个泛音的组合关系有吗,比如有多少个泛音,以及这些泛音之间的权重,是不是自己要去电子设备上去试验。

那是不是指,某个特定的音色,就固定了,泛音的个数,同时确定了他们之间的组合时的权重系数。

作者: 包子    时间: 2021-6-9 19:03
捣江湖 发表于 2021-6-9 14:57
妙啊。

那个泛音的组合关系有吗,比如有多少个泛音,以及这些泛音之间的权重,是不是自己要去电子设备上 ...

乐理水平很低,我大概就是知道在吉他上,1/2的泛音要强于1/3,1/13强于1/4,以此类推。
可能强度的关系吧,一般的情况下很少演奏1/2以下的泛音。
作者: 陈王奋起挥黄钺    时间: 2021-7-12 19:20
包子 发表于 2021-6-8 18:29
大概说一下,发声体振动产生声音,波长最长的叫基音,以基音为标准,波长通常为基音的整数分之一的音为泛 ...

严格来说并非如此,手拨琴弦或者击打琴弦,原始的振动是1Hz甚至是低于1Hz的振动,振动沿着琴弦传播,形成一次共鸣,就是驻波,这个波往往被看成是基波,基波带动周围的空气,继续在琴的腔体二次共鸣。这两次共鸣都有大量的高次谐波,他们共同构成了乐器的音色。




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2