詳細內容
1.互聯(lián)網(wǎng)信息的高效采集,尤其是社交媒體,包括微博、QQ空間、微信公眾號等等。受限于IP地址、用戶(hù)賬號等,社交媒體的采集難以高效,有些媒體比如QQ空間難以采集。要求對采集的信息從全面性、時(shí)效性等角度進(jìn)行研究突破。2.信息的相關(guān)性判定,一方面根據采集關(guān)鍵字(或者組合)判定采集信息的相關(guān)性,另一方面采用爬蟲(chóng)采集的方法,判定屬于特定專(zhuān)題的相關(guān)性,要求信息相關(guān)性判定準確率75%以上;3.信息的正負面判斷,研究突破信息的正負面識別方法,要求準確率80%以上;4.研究突破用戶(hù)發(fā)表信息的情感傾向性判定方法,要求準確率80%以上;5.研究突破話(huà)題提取、熱點(diǎn)分析的方法,要求話(huà)題提取準確率70%以上,熱點(diǎn)分析的準確率75%以上。企業(yè)多年從事互聯(lián)網(wǎng)輿情監測、企業(yè)情報監測的技術(shù)攻關(guān)與產(chǎn)品研發(fā)的研究,在互聯(lián)網(wǎng)信息采集、信息的深度分析等方面已經(jīng)有了一定的基礎,研發(fā)的產(chǎn)品已經(jīng)在全國范圍推廣應用。但是,在信息采集的時(shí)效、特定目標的采集等方面需要提升,在信息的深度分析,包括相關(guān)性判定、正負面判斷、情感傾向分析、熱點(diǎn)挖掘等等方面需要提升。公司目前已經(jīng)有與此產(chǎn)品技術(shù)相關(guān)的研發(fā)團隊6人,擬投入資金30萬(wàn)元圍繞上述目標開(kāi)展技術(shù)攻關(guān)。