每日經濟新聞 2017-09-05 19:09:42
2017中國上市公司口碑榜進入大數據篩選階段已有半個月,完成了“政治關”篩選后,評選正式開始“輿情關”篩選。我們對1205家上市公司設置了相應的關鍵詞,并根據這些關鍵詞組,采集到了超過175萬條的新聞量;之后,將根據口碑榜指數計算標準進行運算,甄選出600家入圍上市公司。
每經編輯 每經記者 左越
每經記者 左越 每經編輯 肖鴻月
上周,2017中國上市公司口碑榜完成了對提名上市公司的“政治關”篩選,并有31家上市公司折戟,1205家上市公司成功進入“輿情關”篩選。算算時間,第二階段大數據篩選的時間也已經過去一半。
根據最新進展,慧科訊業已經完成了對這1205家上市公司的新聞數據采集工作;在接下來的10余天時間,還將通過大數據技術手段,對超過175萬條新聞信息數據進行計算。按照此前已制定好的口碑榜計算標準、計算公式進行輿情評分后,得分最高的600家上市公司將進入2017中國上市公司口碑榜入圍名單。
2017中國上市公司口碑榜進入大數據篩選階段已經有半個月的時間,在這半個月當中,慧科訊業已經完成了“政治關”篩選,現已進入“輿情關”篩選階段。
在經歷了“政治關”的一票否決之后,進入“輿情關”篩選的上市公司數量變為1205家。慧科訊業正是在這一階段對這1205家上市公司運用大數據手段,展開全方位的篩選。
具體來看,慧科訊業對這1205家上市公司設置了相應的關鍵詞,關鍵詞量超過6000組。根據這些關鍵詞組,慧科訊業采集到的新聞量超過了175萬條。值得注意的是,每組關鍵詞都包含了上市公司的全稱、簡稱和別稱。舉個例子,浦發銀行對應的一組關鍵詞就是,“上海浦東發展銀行股份有限公司”、“浦發銀行”、“浦發行”。
這些被采集的新聞,正是從此前《每日經濟新聞》與慧科訊業共同選定的100家最重要的財經類,或綜合新聞類重要媒體,通過標題命中方式抓取相關新聞,回溯相應時間段內,關于入圍上市公司的相關新聞報道。采集時間跨度為過去的11個月,即2016年10月1日~2017年8月20日。
截至目前,慧科訊業已經完成“輿情關”新聞數據的采集工作。慧科訊業相關負責人也向《每日經濟新聞》記者介紹道,“之后,將由慧科人工智能研究院對數據進行‘正、中、負’情感分析;慧科媒體管理部根據媒體評級、新聞總量及情感分析結果,進行榜單計算。”
在隨后的兩周時間中,慧科訊業將根據此前已經確定的口碑榜指數計算標準進行運算和排名。在這一階段里,將要用到的口碑榜指數計算標準,正是根據此前《每日經濟新聞》與慧科訊業共同確定的媒體評級、新聞總量、正負面的凈好評率等參數來構建。
每家上市公司的輿情得分結果,是將凈好評率、正負面新聞數量等指標賦予不同權重,加權得到的最終結果數值。當凈好評率大于0時,正面、中性數據越多,指數越大;反之,當凈好評率小于0時,意味著負面越多,指數越小,說明這家上市公司的相對較差。
根據時間安排,所有大數據篩選工作預計將在9月20日完成,2017中國上市公司口碑榜的600家入圍公司名單也將隨之誕生。
一路過關斬將,大數據篩選階段的完成卻遠非最后終點。想要到達最終的勝利彼岸,成為2017中國上市公司口碑榜“最亮的星”,入圍的600家上市公司還需在此后將近2個月時間中,接受最后兩大階段的全方位考驗。在9月20日入圍名單誕生后,600家上市公司也將進入口碑榜第三階段“科學模型精準丈量”的評選,即用每經研究院精心構建的科學模型,進行更為嚴苛的篩選。
欲了解更多關于2017中國上市公司口碑榜的新聞動態,您可點擊鏈接(http://www.uoper.xyz/corp/20170809koubeibang/)查看。
數據支持:
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP