傳動網 > 新聞頻道 > 技術前沿 > 資訊詳情

自動化所參與W3C中系列標準的制定工作

時間:2007-01-02

來源:中國傳動網

導語:隨著我國加入WTO,我國的標準化工作越來越呈現國際化的趨勢,無論是自身標準被國際采用

隨著我國加入WTO,我國的標準化工作越來越呈現國際化的趨勢,無論是自身標準被國際采用,還是參與國際標準化組織的步伐都急速的加快。近幾年來,在World Wide Web Consortium (W3C)下面成立了兩個與人機交互密切相關的兩個工作小組,語音合成置標語言 (Speech Synthesis Markup Language – SSML)工作小組、情感標注語言 (Emotion)工作小組,這個標準的制定對面向下一代的人機交互平臺具有十分重要的意義。中國科學院自動化研究所陶建華作為國內學術單位的正式代表,參加了這兩個標準的制定工作,具體情況如下:   一 語音合成標注語言(SSML)   SSML(Speech Synthesis Markup Language)工作組是W3C(World Wide Web Consortium)Voice Browsing Working Group下屬的一個致力于制訂語音合成置標語言規范的團體。工作組的目標是為開發者(主要是針對互聯網的應用)提供一套基于XML語言的規范,使得用戶能夠在不了解語音合成技術細節的情況下,使用這 套規范,調用語音合成引擎,定制所需要的語音。到2005年為止,這個工作組已經推出了SSML1.0:http://www.w3.org/TR/speech-synthesis。   SSML1.0版本針對的主要是英語,沒有考慮到其他語系的特點,使得它無法被更加廣泛地應用。在這個背景下,SSML工作組在2005年開始了語音合成置標語言國際化的工作。中國科學院自動化所作為科學院的唯一代表,加入了SSML國際化的工作,致力于修改當前的SSML版本,使之能更好的適應漢語的需求。   從去年以來,工作組分別于2005年10月、2006年4月、7月和10月,在北京和香港等地召開了四次會議。在這次會議上,對SSML1.0提出了針對漢語特點的若干修改意見,力圖使傳統SSML語言能夠適應于漢語的特殊要求,如漢語的詞特性、拼音標記特性、聲調特性、姓氏特性等。經過這四次討論,已經完成了針對SSML1.0的修改草案。并按照預定計劃在2007年提出SSML1.1版本。屆時,該版本將使XML語言框架中,對中文語音合成能夠產生更好的支持。為推廣漢語語音合成技術的應用,使之能產生更大的經濟效益和社會效益,將產生重要的意義。   二、 情感標注語言(EMOTION)   隨著信息時代的來臨,各種web技術日新月異,紛紛涌現出來。如何引導新技術的潮流,使新技術更好地應用于、服務于日常生活中,是當前IT領域從業者所首先要考慮的問題。近年來,情感的研究一直是人機交互領域研究的一個熱點,由于人類相互之間的溝通與交流是自然而富有感情的,因此,在人機交互的過程中,人們也很自然地期望計算機具有情感以及自然和諧的交互能力。對情感的研究就是要賦予計算機類似于人一樣的觀察、理解和生成各種情感特征的能力,最終像人一樣能進行自然、親切和生動的智能交互。W3C的Emotion小組正是基于這樣一個目的建立的,期望通過全球范圍研究者的討論、交流,建立一個一般意義的、完整統一的情感標注和表達體系,該標注可以應用在任何涉及情感研究的項目,如情感識別、情感表達中,從而促進情感研究的發展。參與Emotion小組的成員包括了中科院自動化所、德國DFKI研究所、德國電信、英國Edinburgh大學、意大利電信等21個成員單位。   Emotion小組所討論的內容主要包括以下三個部分:第一部分是研究情感數據的標注,包括應該標注什么內容以及如何進行標注。所涉及的數據類型相當廣泛,文本數據、語音數據以及多模態數據都在討論范圍之內。第二部分主要處理情感的自動識別和分類,主要研究如何從文字、語音、多模態數據中提取特征,然后利用機器學習算法進行情感的識別。第三部分主要處理情感的產生,研究如何基于一定標準的標注信息產生情感,在包括語音、表情及姿態的多模態數據中產生情感。   中科院自動化所作為整個標準的發起單位之一,參與了所有三個項目的討論,并且同日本Emotion AI的Ian Wilson教授共同擔當情感產生討論小組的主席。中科院自動化所在情感研究方面已經有了較多的研究積累:在情感標注方面,自動化所提出了基于多維矢量的情感標注方法;在情感識別方面,自動化所建立了在通信環境下的情感識別系統,可以判斷對話人的友好度及關注度,并且成功地應用在電信增值服務中,在福州聯通中已經發展到2萬用戶。除此之外,自動化所還研制了基于多模態數據的情感識別系統,通過有效的整合音頻特征和視頻特征,極大地提高了識別的準確率;在情感產生方面,自動化所構建了基于韻律轉換的情感語音合成系統和基于fap參數的情感表情表達系統。   到目前為止,W3C Emotion小組已經召開了三次電話會議,整個標準的討論工作已經漸漸走上軌道,參與討論的各方在一些基本性問題上已經達到了一定的共識。相信隨著討論的深入進展,一定能夠極大地促進情感研究的發展,為創建更為和諧的人機交互環境而鋪平道路。
傳動網版權與免責聲明:

凡本網注明[來源:傳動網]的所有文字、圖片、音視和視頻文件,版權均為傳動網(www.cdcst56.com)獨家所有。如需轉載請與0755-82949061聯系。任何媒體、網站或個人轉載使用時須注明來源“傳動網”,違反者本網將追究其法律責任。

本網轉載并注明其他來源的稿件,均來自互聯網或業內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅與傳動公眾號獲取更多資訊

關注中國傳動網公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅系統
  • 工業電源
  • 電力電子
  • 工業互聯
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯接
  • 工業機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0