DeepSeek深度解析政府工作报告:今年有2大关键词(图)
<div style='font-size:1em;'>2025年3月5日上午,十四届全国人大三次会议在人民大会堂举行开幕会,国务院总理李强作政府工作报告。
基于2025年《政府工作报告》,澎湃新闻透过DeepSeek AI大模型,使用文本向量化的数据分析方法,深度解析报告中的政策密码。
澎湃新闻分析发现,根据2025年《政府工作报告》,今年的经济社会发展任务里,“发展”和“建设”是两大关键词。
<br><br>data/attachment/forum/202503/05/img_cdn_138_94811741163409.png<br>
以“发展”为关键词,通过文本向量化分析,澎湃新闻找到了上百个关联度较高的词汇,如“经济”“创新”“产业”“民生”等。
不仅如此,2025年《政府工作报告》中,“建设”也在围绕着“现代化”“教育”“科技”等维度展开。<div class='google_ads' style='min-height:330px'>Advertisements<div data-onpage=true data-adpath='/339474670,23140269075/6ParkNews/InContent_0'></div></div>
结合中国政府网上的1978年-2024年的《政府工作报告》,澎湃新闻进一步回顾了这48年的《政府工作报告》。
<br><br>data/attachment/forum/202503/05/img_cdn_138_26351741163410.png<br>
分析发现,48年间,“发展”“建设”以及“经济”等词汇,一直高频出现,是《政府工作报告》中的“常青词汇”。
<br><br>data/attachment/forum/202503/05/img_cdn_138_99881741163411.png<br>
还有部分词语愈发频繁地出现在《政府工作报告》中,比如“创新”“民生”“就业”。因其增长趋势,澎湃新闻将此类词语称为“喇叭形词语”。
另外,在2025年《政府工作报告》中,还出现了过去47年未曾提及的词语,例如“具身智能”“智能机器人”“投资于人”等。
<br><br>data/attachment/forum/202503/05/img_cdn_138_89861741163413.png<br>
分析方法:
1. 本文所有原始文本材料来自中国政府网1978年至2025年政府工作报告。
2. 基于DeepSeek等AI大模型的文本向量化技术,对2025年工作展望的高频词进行关联分析,通过提取共现向量和语义相似度向量,量化计算高频词间的关联关系。<div class='google_ads' style='min-height:330px'>Advertisements<div data-onpage=true data-adpath='/339474670,23140269075/6ParkNews/InContent_1'></div></div>
3. 本文使用jieba分词。采用精确分词模式,避免重复分词和歧义。分词结果均去掉数字、单字、标点符号。
4. 为增加分词正确率,在jieba分词的基础上加入自定义词典,自定义词典主要包含了往年人民网和新华网统计的两会热词。
5. 在分词基础上,采用TF-IDF加权技术。词语的重要性随着它在文本中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。本文使用的语料库为1978年至2025年政府工作报告文本。<div class='google_ads' style='min-height:330px'>Advertisements<div data-onpage=true data-adpath='/339474670,23140269075/6ParkNews/InContent_4'></div></div> </div>
页:
[1]