设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 13949|回复: 52
打印 上一主题 下一主题

[科普知识] 语音识别漫话

    [复制链接]
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    跳转到指定楼层
    楼主
    发表于 2011-6-23 13:14:46 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    第一章. {& h" j( z  a: s; D
    随便聊聊语言和语音
    3 d8 h2 y- m" H+ W6 n# j3 {! Q3 s1 f1 l
    语言是什么,语音又是什么?各个百科书上的定义不尽相同,又大致没什么明显差异。

    - G% f$ ]) g3 _( u
    举语言为例,百度百科如是讲:“语言是思维工具和交际工具。它同思维有密切的联系,是思维的载体和物质外壳和表现形式。语言是符号系统,是以语音为物质外壳,以语义为意义内容的,音义结合的词汇建筑材料和语法组织规律的体系。语言是一种社会现象,是类最重要的交际工具,是进行思维和传递信息的工具,是人类保存认识成果的载体。”
    - I1 e4 B% `" O  Y  m) u
    维基上则这样讲:“语言是一套共同采用的沟通符号、表达方式与处理规则。符号会以视觉、声音或者触觉方式来传递。”

    / _$ I9 I1 e' \6 I3 x1 e2 ]
    而互动百科上说:由于研究方法和角度的不同,人们对语言的定义多种多样。有代表性的说法就有几十种。
    6 X' `) `% Q% ^$ L' Y6 U# h# t
    无论如何,语言是人类创造的,用以承载和传递信息的工具。这个对于语言作为工具性描述的定义,包括人类创造的非自然语言(如世界语)和机器语言,也都符合要求。虽然,这个定义没能涵盖语言的其他功能。
    ( Z" |$ ?6 V1 t. u$ S) ~
    语言是怎样起源的?现在没人说的清楚。中国的古代文献里只提到仓颉造字,也不知有没有文献里记载语音的产生或者探讨语音的产生。我不是这方面的专家,还请老丁,太傅,张王,虎老师,江城等诸位国学深厚的大拿说说。至于西方,也并无类似记载。有记载的唯有中东的古埃及时代。

    , m  [% P/ ^+ F! ?$ `
    在古希腊史学家希罗多德的《希波战争史》的上卷曾记载有这样一个故事:公元前6世纪古埃及努比亚王朝那个驱逐了亚述占领而复国的名叫萨姆提克一世(或者几世)的法老,他很想知道哪种语言是世界上最古老的语言,于是就把两个初生的婴儿送到与世隔绝的地方喂养,严禁任何人在他们面前交谈。两年后的一个早晨,这两个孩子突然手舞足蹈地喊出了“biex”这个词。法老派人查访后,发现腓尼基语中有发音和这个接近的词,意思是面包。于是法老就宣称腓尼基语是世界上最古老的语言。如果这个故事是真的,那它告诉我们,古埃及人对语言 的起源问题很早就有兴趣,并用他们想当然的方法进行了有趣的探索(岑麒祥,1985)。希罗多德的下卷记录希波战争很是确切,但是上卷类似随笔,记载各地风土人情,传闻轶事,所以这个我以为算是孤证,因为这件事距离他本人也有近百年了。
    # D, }! c% S3 z( o' @: L4 t
    从两千多年前的法老到十九世纪,各种关于语言起源的理论非常多。比如有人认为语言起源于原始人劳动时发出的声音(唷,希呵理论);或模仿大自然的声音慢慢建立语言(叮当理论);还有认为是模仿动物的叫声开始的(Bow wow理论)。这些理论多数没有什么科学价值,也就是把科学的东西和宗教,哲学的混在了一起,而且在方法上也是用哲学方法推测,不是科学方法实践。这些说法都是不可能有反证的,因此也没有被证明的可能性(王士元,彭刚,2006)。几百年来许多哲学家和语言学家耗费大量精力来研究这个问题,事实上倒是阻碍了语言学的进展。结果1866年法国语言协会订立了一条规则,不接受有关语言起源的报告和文章,此后多个语言协会也订了类似的规则。结果,此后100多年,没展开过什么语言问题起源的讨论。

    " S$ P7 I$ T  ]( |7 K6 e
    下面说说语音。

    评分

    参与人数 3爱元 +15 捐资 +2 学识 +1 收起 理由
    煮酒正熟 + 5 + 2 + 1
    万里风中虎 + 5 欢迎老燕
    海天 + 5

    查看全部评分

  • TA的每日心情
    开心
    2024-2-16 14:50
  • 签到天数: 818 天

    [LV.10]大乘

    沙发
    发表于 2011-6-23 13:25:29 | 只看该作者
    回复 燕庐敕 的帖子
    9 l9 U' M/ V0 E+ k" X
    3 }: z# `7 D# K$ E, Z) w! |6 W这个怎么发这里了?似乎发“原创精品”那里更合适些
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    板凳
     楼主| 发表于 2011-6-23 13:27:08 | 只看该作者
    回复 雪个 的帖子8 O' Q7 a5 ]9 D) c

    4 w9 _' i( e) N发错了,应该是科技探索那里。太傅能不能给转版?

    点评

    我好想没有权限转版,太傅可以帮忙转一下吧。  发表于 2011-6-23 19:01
    科技是群组,没什么人看的。。。还是别转那里吧  发表于 2011-6-23 13:39
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    地板
     楼主| 发表于 2011-6-23 14:31:14 | 只看该作者
    回复 燕庐敕 的帖子
    1 A+ q( C2 N5 f; R/ b) x% ^
    $ }3 j' O. p# f) O% y能转到哪里算哪里吧。
    ' a- m; b4 |" ~* t- p  B/ l+ z0 }2 {$ E( u* ^& S' _) t: `
    这个才开始写,当年答应你和仙人的。俺没有说话不算,就是太拖拉了---那年是2007年。
    8 R) Y/ z# c, h: Y) u
      R2 Z4 o/ x. Z6 W2 }; v$ r杂七杂八写了一些类似八卦的棋手的故事,放在哪个版面好?

    点评

    棋手的故事如果是完全虚构的进原创版“小说”,如果杂文进原创版“其他”,如果是真人名人八卦进“八卦”  发表于 2011-6-23 19:41
    晨枫不在,我来转,但是业务不熟练,谁来指点一下我  发表于 2011-6-23 18:56
    等晨兄上线时挪到原创精品版。  发表于 2011-6-23 14:36
  • TA的每日心情

    2019-2-21 00:29
  • 签到天数: 16 天

    [LV.4]金丹

    5#
    发表于 2011-6-23 18:31:26 | 只看该作者
    回复 燕庐敕 的帖子
    % c) ~7 T" c& d' h0 |; S, R- I& q; J6 r% w) W
    欢迎老燕 !这篇移到原创精品好,那里挣钱多。5 z) B+ x: p7 V7 k6 h$ K

    * U) N2 G1 e# C好像有个理论说语言的出现极大地加快了人类的进化。
    : I& n3 g$ D. z- s2 s4 H" c( K2 a0 @$ n. _$ N

    该用户从未签到

    6#
    发表于 2011-6-23 19:20:55 | 只看该作者
    啊,特别想听这个!

    点评

    恩,没问题,我刚参加完音乐声学的香山科学会议,装乖装得累地半死,我还得休整两天  发表于 2011-6-24 07:12
    过两天来催你的声乐贴,先让你休息几天毕业答辩。  发表于 2011-6-23 19:43
  • TA的每日心情
    开心
    2019-2-20 08:00
  • 签到天数: 108 天

    [LV.6]出窍

    7#
    发表于 2011-6-23 19:29:15 | 只看该作者
    坐等后续帖子。: f2 V# w+ X& P2 |

      @# z# ?. V# @; B) A/ y李开复做语音很强

    该用户从未签到

    8#
    发表于 2011-6-23 21:20:09 | 只看该作者
    回复 燕庐敕 的帖子
    2 B  a' ~0 ~/ \1 y0 ^
    $ e5 P  }; Y, [6 O# P. g9 ~6 R会涉及到基于统计的方法么?想听听老燕的看法

    该用户从未签到

    9#
    发表于 2011-6-23 22:17:32 | 只看该作者
    ; e0 ]7 \& ^, w- W, W
    等下文
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    10#
     楼主| 发表于 2011-6-24 08:55:41 | 只看该作者
    回复 Radiohead 的帖子  C) p3 _# ?* [5 \

      q( q1 J$ e/ }$ G  h李开复在真实意义上,就是用统计学实现语音识别的第一个成功实践者。

    点评

    语音识别有训练的 练得越多 采样率越好 识别率也就越高  发表于 2012-5-1 20:31
    现在英文最高的识别率能有多少?汉语的呢?  发表于 2011-6-24 18:55
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    11#
     楼主| 发表于 2011-6-24 08:56:12 | 只看该作者
    回复 PenPen 的帖子8 K: z% W2 U2 s6 J+ J4 W
    / O! z. C; [+ j" S/ l4 n
    当然,绕不过去的。
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    12#
     楼主| 发表于 2011-6-24 09:00:03 | 只看该作者
    回复 穿越 的帖子* M( P0 {) z# i1 \! z% h0 Z
    3 b8 D+ V3 l+ F& F
    师弟好
  • TA的每日心情
    慵懒
    2024-1-31 16:37
  • 签到天数: 1114 天

    [LV.10]大乘

    13#
    发表于 2011-6-24 09:55:31 | 只看该作者
    回复 燕庐敕 的帖子) p/ W) \" q/ A( J% k7 |: i
    / F5 [4 b0 W  `( `' g- H* c8 q
    支持老燕
  • TA的每日心情
    擦汗
    2025-5-22 23:34
  • 签到天数: 3170 天

    [LV.Master]无

    14#
    发表于 2011-6-24 22:12:54 | 只看该作者
    回复 穿越 的帖子4 @# M9 }0 A1 Q9 P

    / m9 O6 S, G+ ^8 T* P# n我想也是的,应该可以极大地提高人和人之间信息交流的速度。
    % a9 c* ^9 M; Y, j( N% q0 I3 }6 U+ q. n* o! M* E7 c
    而文字的出现,提供了信息保留和复制能力。
    ! V4 c  `; c- C* O; }- u3 O
    $ z7 h. ~8 \; b2 S+ g2 @互联网和数码化,提高了信息交流,保留,复制,还有检索的能力。

    该用户从未签到

    15#
    发表于 2011-6-26 02:12:36 | 只看该作者
    回复 燕庐敕 的帖子
      U  ]/ ?6 S9 A: u/ p- K: \5 H7 X  S' y# z& O+ e0 r2 N) g) y
    人类的语言功能由两个重要的基因开关决定,而会用叫声表达特定对象的动物在自然界也不少, 所以哲学家和语言学家不了解生物进化史是不行地
  • TA的每日心情
    郁闷
    2022-6-19 00:00
  • 签到天数: 2264 天

    [LV.Master]无

    16#
    发表于 2011-6-26 04:53:27 | 只看该作者
    赫然 发表于 2011-6-24 22:12
    ! c& ]6 e, i) _( b7 t+ N# A6 K回复 穿越 的帖子. k2 [5 ]; m. {7 L1 D- \$ }

    * ^4 ^4 B$ r  `0 A9 u- E我想也是的,应该可以极大地提高人和人之间信息交流的速度。
    . r" u& L$ z+ k  r6 |- k
    小赫,俺觉得,之所以语言的出现极大推动了人类进化进程,恐怕跟语言对人类大脑的积极反作用有关。或者说是:人类大脑进化到一定程度后发展出了语言,而一旦出现了语言之后,它的不断发展又反过来给予大脑的发展以极大的助力。这大概有点儿象经济与金融的关系(当然,金融对经济有负面作用,而语言对大脑似无负面作用)。
    : i3 D/ p( l$ w+ \
    & R& u; x( F* D2 a; T4 L俺胡抡一下,借以欢迎老燕!
    7 [' w; y- n6 r" @) W
  • TA的每日心情
    擦汗
    2025-5-22 23:34
  • 签到天数: 3170 天

    [LV.Master]无

    17#
    发表于 2011-6-26 05:13:43 | 只看该作者
    回复 煮酒正熟 的帖子( Y6 H' X2 c4 f5 b' l! J" N
    * ~( U* D& H3 A0 p0 X5 _) l
    这个角度有理的。9 H( s- n, A) k7 m  R

    ' ?1 A* a+ n2 v在对老年痴呆的治疗中,语言训练是很重要的一部分。
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    18#
     楼主| 发表于 2011-6-26 23:06:47 | 只看该作者
    回复 darkingwing 的帖子
    ( N& u3 k3 U% o7 t2 K& k, E3 k2 r7 Y0 e$ t
    这个展开就太广了。基因决定了可以发出复杂的声音到人类学会用复杂而抽象的声音表达复杂的意思,这个课题恐怕远远大于语音识别。我没能力在这里探讨这些。

    点评

    原来你是要讨论语音识别啊,俺看到了一堆语言学家在讨论语言起源...  发表于 2011-6-26 23:47

    该用户从未签到

    19#
    发表于 2011-6-26 23:49:01 | 只看该作者
    回复 燕庐敕 的帖子
    ; K- M, Y9 r4 q3 Q) s  t! i' U( A) L4 c4 T  }9 ?4 M9 Z7 [4 {1 @  |
    中文的语言识别几年前据说效率差强人意,不知道现在进展如何,英语似乎已经解决了
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

    20#
     楼主| 发表于 2011-6-27 12:43:53 | 只看该作者
    回复 darkingwing 的帖子9 {  k$ j* C& e% F
    2 C8 A' e7 @! c% Z
    慢慢往下看,我会提到的。- e! K% w/ @" ]5 P
    ; e( f: E9 P0 |) v- c! [0 T' a
    这个不是我的专业,是家里领导的。不过20年了,真就是没吃过猪肉还没见过猪跑吗?

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2025-8-24 21:45 , Processed in 0.059998 second(s), 18 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表