【摘要】后視圖與主視圖對稱,省略后視圖。【專利類型】外觀設計【申請人】張永春【申請人類型】個人【申請人地址】100083北京市海淀區北京航空航天大學新主樓A105室機械工程及自動化系705教研室【申請人地區】中國【申請人城市】北京市【申請人
【摘要】 本發明涉及一種語音和文本聯合驅動的卡通人 臉動畫生成方法,包括建立語音視位映射庫、文本分析、語音 切分及語音合并、視位參數拼接步驟;本發明的優點在于:能 夠自定義音節-視位映射,從而實現各種具有夸張表情效果的 唇型和臉形,最終合成卡通人臉動畫;不需要大規模數據庫進 行訓練;能夠在文本的指導下,進行語音切分,提取音節時長 信息,從而合成具有唇型和表情同步的人臉動畫。 【專利類型】發明申請 【申請人】中國科學院計算技術研究所 【申請人類型】科研單位 【申請人地址】100080北京市海淀區中關村科學院南路6號 【申請人地區】中國 【申請人城市】北京市 【申請人區縣】海淀區 【申請號】CN200610114495.6 【申請日】2006-11-10 【申請年份】2006 【公開公告號】CN1971621A 【公開公告日】2007-05-30 【公開公告年份】2007 【授權公告號】CN100476877C 【授權公告日】2009-04-08 【授權公告年份】2009.0 【發明人】陳益強; 劉軍發 【主權項內容】1、一種語音和文本聯合驅動的卡通人臉動畫生成方法,其特征 在于,包括如下步驟: 1)輸入一段語音數據及其相應的文本,對所述輸入文本進行文 本分析,提取所述輸入文本中所有的有效發音音節,得到輸入語音數 據中所包含的音節個數;并根據所述有效發音音節查找音節視位映射 庫,得到輸入語音中每個音節所對應的視位參數子序列; 2)采用雙閾值端點檢測算法對輸入的語音數據進行語音切分, 得到一系列語音段,該語音段個數多于步驟1)中得到的音節個數; 不斷地將時長最短的語音段與其相鄰語音段合并,直到語音段的數目 與步驟1)中得到的音節個數一致,將最終得到的各語音段的時長作 為各音節的時長信息; 3)根據步驟2)中獲得的各音節的時長信息,將步驟1)中得到 的各音節的視位參數子序列拼接成整個輸入語音的視位參數序列,將 該視位參數序列作為最后輸出的連續的動畫參數。 【當前權利人】中科樂聽智能技術(濟南)有限公司 【當前專利權人地址】山東省濟南市先行區崔寨街道中科新經濟科創中心3-1號樓622室 【統一社會信用代碼】12100000400012342E 【被引證次數】TRUE 【家族被引證次數】TRUE
未經允許不得轉載:http://www.mhvdw.cn/1776132723.html
喜歡就贊一下






