們的一切努力得到了最好的回報,我們的論文成功的入選了2005年的SIGGRAPH。
乾麵包還是鮮麵包,這是個問題。
那年八月,我和Steve Lin在SIGGRAPH上宣讀了我們的這篇論文。論文宣讀完後,大家對我們的工作都很感興趣,幾個人提了一些技術問題。最後,這個Session的Chair走到麥克風前,問道:“你們的工作很出色,但是我看到你們的渲染結果,那個麵包看上去有些幹,看著像是乾的麵包,你能解釋一下為什麼嗎?是繪製或者建模的問題嗎?”我聽了,一邊心裡樂,一邊佩服他的眼力。我走到臺前,回答說:“你說的太對了,實際上,由於我們的資料捕捉需要十幾個小時,所以,我們捕捉到的真的是一個乾麵包的資料”。場上的聽眾被我們的這一問一答逗樂了,大家不禁大笑,接著熱烈鼓掌,感謝我們精彩的論文宣讀。
(透過演算法,計算機自動繪製出來的麵包)
寫在最後的幾句話
上面的一個小故事,是我在SIGGRAPH 2005的一點經歷。這點經歷,也許能夠讓大家看到在我們每篇論文背後,我們所付出的不為人知的認真與努力。就在這樣一次次SIGGRAPH的努力中,在學習、挫折與汗水中,我也在慢慢的成長。不知不覺中,我在微軟研究院已經工作了快十個年頭。回想起這十年,我覺得我是幸運的,因為在這裡我圓了我做計算機圖形研究的一個夢想。而且,我有幸結識了許多優秀的人、有趣的人,並和很多人成了好朋友。和他們一起並肩工作的日子,已成為了我過去最美好的回憶。而我們將來一起奮鬥的日子,是令我期盼與興奮的人生體驗。
作者介紹:
童欣博士是微軟亞洲研究院網路圖形組研究專案負責人,研究興趣主要為圖形學演算法,系統,表觀造型等。他1999年從清華大學博士畢業,同年加入微軟亞洲研究院。曾經是偽小資真憤青,現在為準中年宅男。
。 想看書來
“木蘭”媽媽 初敏(1)
“木蘭”是我加入微軟後帶領幾位年輕同事研發出來的雙語文語轉換系統(text…to…speech,簡稱TTS)。她不僅能將中文、英文文稿流暢的朗讀出來,還能很好的處理混雜著很多英文單詞、短語和句子的文稿。在研究院成立五週年的慶祝活動中,木蘭名列‘十大’成果之一。我常常引以為豪。木蘭凝聚了我多年的心血,就像我的另一個孩子,在我的孕育、撫養下,從無到有,從小到大,逐步完善,改進。最終成功的‘嫁’到微軟最新作業系統Vista中,並且由此孵化出微軟唯一的一個TTS產品部門。以前,一個在總部產品部門的同事Scott Meredith,也是TTS的專家,在向別人介紹我的時候,總忘不了說一句“She is the mother of Mulan TTS system”。我總是欣然接受“木蘭媽媽”這個稱呼。
“木蘭”是這樣誕生的
我是2000年初加入研究院的,是研究院的第一位女性研究員,也是研究院第一個從事TTS研究的人。我帶領的這個TTS小組在很長時間都是微軟內部唯一的一個從事語音合成技術研發工作的團隊。憑藉著在中文語言文化上的優勢,我們差不多花了一年左右時間專門從事中文語音合成的研究,做出了一個合成效果非常好的原型系統。之後的一、兩年,我們把研究重點轉移到了英語語音合成上面,也取得了相當好的效果。
接下來我們選擇的方向就是解決中英文混讀的問題。隨著網際網路的發展,中西方文化的交融,越來越多的中文文章中會雜糅有英文內容,可能是某產品的品牌型號,也可能是一首著名歌曲。遇到這樣的文章,傳統文語轉換系統就撓頭了。最典型的解決方案就是在後臺架起兩個系統,一個專門處理中文,一個專門處理英文。遇到中英文混雜的句子,就將中文部分分割出來送給中文系統,英文部分則送給英文系統,然後將兩者的輸出合併起來返回給使用者。這樣做的最大缺陷在於分開處理的兩種語言缺乏統一的語調、語氣,甚至連聲音本身都差別很大。這樣的結果聽上去時斷時續,極為不連貫。可懂度(能聽懂)和自然度(聽起來舒服)都比較差。我們當時花了很多精力去物色一箇中英文都比較強的播音員,為我們的語音系統錄音,這樣就可以保證語音資料庫中的雙語聲音是一致的。另外我們還將中英文的處理能力融合在一個系統中,有統一的韻律控制,這樣生成的語句即便包含兩種語言,也能有