【摘要】本發明公開了一種基于統計方法的質譜中噪音基線識別方法。該方法,包括步驟:1)按照譜峰強度分布性質將質譜譜峰至少分成兩類;2)對上一步驟中的不同類別的譜峰分別計算其強度的分布參數;3)用譜峰類別的強度分布參數來刻畫廣義的噪音基線;4)
【摘要】 。本發明是一種基于倒排表進行檢索提示的方法, 它包括如下步驟:建立主引擎使用的主倒排表和次引 擎使用的次倒排表;將用戶輸入的檢索串切分成詞,用主 引擎檢索出包含這些詞的文檔,并將這些文檔進行相關度排 序,得到檢索結果。再將檢索串切分成字,用次引擎檢索 出包含檢索串中每一個字的詞,再對所有檢索出的詞匯進行優 先度排序,得到排序后的檢出詞序列;向用戶提供檢索提示時, 按照從次引擎中檢索出的檢出詞序列的順序顯示每個檢 出詞,并在每個檢出詞后面顯示出包含這個檢出詞的文檔數 目。本發明基于待檢索文檔的內容來進行檢索提示,它較基于 查詢詞統計的檢索提示有如下優點:可以把少見的、信息量大 的詞給提示出來;所提示的詞冗余數量少,跨越范圍大,能夠 給用戶更加廣度的提示;能提示出鮮為人知的檢索詞,并能列 出每個檢索提示詞會在多少篇文檔中出現,從而擴展用戶的知 識面,幫助用戶進行更準確的檢索。 【專利類型】發明申請 【申請人】北京航空航天大學 【申請人類型】學校 【申請人地址】100083北京市海淀區學院路37號 【申請人地區】中國 【申請人城市】北京市 【申請人區縣】海淀區 【申請號】CN200610112822.4 【申請日】2006-09-04 【申請年份】2006 【公開公告號】CN1916905A 【公開公告日】2007-02-21 【公開公告年份】2007 【授權公告號】CN100437585C 【授權公告日】2008-11-26 【授權公告年份】2008.0 【IPC分類號】G06F17/30 【發明人】曹勇剛; 曹羽中; 金茂忠; 劉超 【主權項內容】1.一種基于倒排表進行檢索提示的方法,其特征在于它包括如下步驟: ●建立主引擎使用的主倒排表 把全部待檢索文檔切分成詞,對切分后的詞進行索引,建立以詞為索引、包含此詞的 文檔編號列表為值的倒排表,稱之為主倒排表。使用主倒排表對文檔進行索引和檢索的部 分即為主引擎,主引擎用于根據查詢串中的詞檢索包含該詞的文檔; ●建立次引擎使用的次倒排表 把上一步驟中切分后的詞再切分成字,對切分后的字進行索引,建立以字為索引、包 含此字的詞為值的倒排表,稱之為次倒排表,使用次倒排表對詞進行索引和檢索的部分即 為次引擎,次引擎用于根據查詢串中的字檢索包含該字的詞; ●用主引擎檢索文檔 將用戶輸入的檢索串切分成詞,用主引擎檢索出包含這些詞的文檔,再對所有檢 索出的文檔進行相關度排序,得到排序后的檢出文檔序列; ●用次引擎檢索詞 將用戶輸入的檢索串切分成字,用次引擎檢索出包含檢索串中每一個字的詞,再 對所有檢索出的詞進行優先度排序,得到排序后的檢出詞序列; ●檢索提示 向用戶提供檢索提示時,按照從次引擎中檢索出的檢出詞序列的順序顯示每個檢 出詞,并在每個檢出詞后面顯示出包含這個詞的文檔數目。 【當前權利人】北京航空航天大學 【當前專利權人地址】北京市海淀區學院路37號 【統一社會信用代碼】12100000400011227Y 【被引證次數】31 【被他引次數】31.0 【家族引證次數】5.0 【家族被引證次數】31
未經允許不得轉載:http://www.mhvdw.cn/1776146990.html
喜歡就贊一下






