靈玖軟件榮獲“中國大數據較佳行業(yè)實踐案例”

時間：2020-01-05

作者：靈玖中科軟件（北京）有限公司

詞條
詞條說明
NLPIR語義技術助力解決文本數據挖掘難題
近年來，隨著Internet?的迅猛發(fā)展以及人們利用信息技術生產和搜集數據能力的大幅度提高，大規(guī)模的網絡文本庫不斷涌現。為了便于在海量文本庫中搜尋、過濾、管理這些文本，基于人工智能技術的文本大數據挖掘成為人們研究的焦點。數據挖掘(KD)是從數據中自動抽取模型。數據挖掘包括許多步驟：從大規(guī)模數據庫中(或從其他來源)**數據;選擇合適的特征屬性;挑選合適的樣本策略;剔除數據中不正常的數據并補足不夠
NLPIR語義分析平臺為中文分詞開創(chuàng)新途徑
伴隨著計算機的日益普及，互聯網的迅猛發(fā)展，文本的數量(電子郵件、新聞、網頁、科技論文等)在不停的增長，因而對文本作智能化處理以獲取所需信息的需求日益迫切。在這樣的社會需求下，自然語言處理技術的地位和作用日益重要。經過幾十年的研究，計算機處理自然語言的理論基礎日趨成熟，應用范圍也越來越廣，初步形成了面向各種不同應用和研究的技術體系。分詞作為自然語言處理的* 一個步驟，是其他高層應用的基礎，起著較
Nlpir Parser智能平臺靈玖軟件新推出的文本挖掘系統(tǒng)
文本挖掘已經成為數據挖掘中一個日益流行而重要的研究領域。與一般數據挖掘以關系、事務和數據倉庫中的結構數據為研究目標所不同的是，文本挖掘所研究的文本數據庫, 由來自各種數據源的大量文檔組成。這些文檔可能包含標題、作者、出版日期、長度等結構化數據, 也可能包含摘要和內容等非結構化的文本成分，而且這些文檔的內容是人類所使用的自然語言，計算機很難處理其語義。因此傳統(tǒng)的信息檢索技術已不適應日益增加的大量文
大數據九眼智能技術網絡信息治理新方向
當下，**信息技術創(chuàng)新日新月異，以數字化、網絡化、智能化為特征的信息化浪潮蓬勃興起。沒有信息化就沒有現代化。截至2017年6月，我國網民規(guī)模已達到7.51億，伴隨著移動互聯網的普及程度不斷提高，上網人數和上網便捷程度不斷增加，我國互聯網上每日產生的違法有害信息數量隨之變得十分巨大，發(fā)現和處理這些違法有害信息的難度也隨之增加。如何控制網絡有害信息泛濫蔓延，實施精確打擊，規(guī)范凈化網絡空間，較大限度降