每日經濟新聞 2017-09-12 18:59:40
還有最后一周時間,2017中國上市公司口碑榜的第二階段評選將告一段落;同時,600家入圍上市公司名單也將正式誕生!
目前,第二階段大數據篩選的工作,已經來到第二輪“輿情關”的數據統計階段。值得注意的是,在大數據篩選的過程中,我們讓AI來幫了個忙。
每經編輯 每經記者 左越
每經記者 左越 每經編輯 肖鴻月
隨著2017中國上市公司口碑榜第二階段評選的截止日期(9月20日)逐漸臨近,這一階段的大數據篩選也進入到了沖刺時間。
根據最新進展,慧科訊業的大數據篩選已經完成了數據機打和復核工作,目前數據統計工作已經啟動。所有大數據篩選工作完成后,2017中國上市公司口碑榜600家入圍上市公司名單,也將在9月20日正式誕生。
距離600家入圍公司名單出爐,僅有一步之遙。究竟是哪600家上市公司將成功闖關大數據篩選?讓我們拭目以待。
自8月21日,2017中國上市公司口碑榜跨入大數據篩選階段,在過去三周的時間中,慧科訊業完成了對1236家上市公司“政治關”的掃描以及1205家上市公司“輿情關”的數據采集工作。
距離口碑榜第二階段的第二次篩選結果出爐,僅有最后一周的時間,慧科訊業的大數據篩選也正在緊鑼密鼓地進行中。慧科訊業相關負責人也向《每日經濟新聞》記者介紹道,根據最新進展,已經完成了數據機打和復核,最終的數據統計工作現在已經開始。
據悉,這一階段的“數據機打和復核”工作,與此前報道過的“輿情關”篩選進展密切相關。
上周,慧科訊業通過對1205家上市公司設置相應的關鍵詞,采集新聞數據。最終關鍵詞量超過6000組,采集到的新聞量超過了175萬條。在完成數據采集之后,根據此前《每日經濟新聞》與慧科訊業共同討論確定的正面、負面、重大負面的判斷標準,以及相應描述和示例,慧科訊業隨機抽取部分新聞,供資深財經編輯根據雙方確認的標準,對6000條新聞樣本進行人工標注——標注其新聞性質為正面、負面還是重大負面等,以供機器學習。
此后,AI機器根據人工判斷新聞的素材進行學習,不斷調整模型和算法,達到理想的準確率和召回率水平。
在AI機器對全部新聞數據進行情感判斷的過程中,AI會對把握較低的新聞打上相應的“Confidence”標簽。例如,標記“1”為沒有疑問;低于“1”則表示機器有疑問。人工則會對“Confidence”標簽有疑問的新聞進行重點檢查,最終完成所有新聞的情感判斷。
在大數據篩選階段的人工復核工作完成之后,正如慧科訊業相關負責人提到的,大數據篩選的最終數據統計工作也逐漸展開。
根據2017中國上市公司口碑榜評選的時間安排,預計大數據篩選階段的最終截止時間在9月20日。這也意味著,我們對公眾提名階段脫穎而出的1236家上市公司,嚴苛篩選一個月后,即將在下周揭開2017中國上市公司口碑榜第二階段600家上市公司入圍名單的面紗。
不過,對于下周即將突圍成功的600家上市公司來說,此時說“成功”,其實還為時尚早。因為在口碑榜評選第二階段大數據篩選結束后,600家入圍公司將立即進入下一階段——2017中國上市公司口碑榜第三階段“科學模型精準丈量”。
在口碑榜第三階段的“科學模型精準丈量”,每經研究院已經嚴陣以待,將用精心構建的科學模型對600家上市公司進行更為科學、嚴謹、全方位的篩選。
究竟是哪600家上市公司會戰勝高達50%的淘汰率,獲得進入口碑榜第三階段的入場券呢?9月20日,我們將為您正式揭曉!
欲了解更多關于2017中國上市公司口碑榜的新聞動態,您可點擊鏈接(http://www.uoper.xyz/corp/20170809koubeibang/)查看。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP