12日, 北京大学法制与发展研究院大数据法律研究中心发布了题为《2014年
当我们在谈论最高人民法院时我们在谈什么》的研究报告。
根据该研究报告,按热度降序排列的十大关键词依次为“网络侵权”、“上下班途中”、“唐慧”、“老赖”、“四五改革”、“巡回法庭”、“环境”、“减刑、假释”、“消费者”以及“3Q大战”,同时也列举了“伪基站”、“投案自首”、“涉医犯罪”和“老鼠仓”等其他热议关键词。
排名第一的是网络侵权一词。2014年10月9日,最高人民法院通报《关于审理利用信息网络侵害人身权益民事纠纷案件适用法律若干问题的规定》的有关情况,同时公布八起利用信息网络侵害人身权益的典型案例。该规定明确了非法删帖、网络水军的责任承担、转载网络信息行为的过错及程度认定、个人信息保护范围、网络服务提供者是否“知道”侵权等内容,对于规范网络行为、建立良好的网络秩序,具有重要的意义。
由于网络媒体是当前人们获取信息、认识周边事物的重要渠道,故该份研究报告从这一角度出发,从人们所实际接收到的信息出发对最高人民法院去年一年的工作进行回顾。
排名第二的是上下班途中。2014年4月21日,最高人民法院通过了《关于审理工伤保险行政案件若干问题的规定》,规定对社会保险行政部门认定诸如在合理时间内往返于工作地与住所地等情形为“上下班途中”的,人民法院应予支持。
排名第三的是唐慧一词。2014年6月12日,最高人民法院依法裁定不核准周军辉、秦星死刑,发回重审;9月5日,湖南省高级人民法院公开宣判,周军辉、秦星被判处无期徒刑。唐慧案前前后后持续八年,吸引了社会各方的关注,间接促成了劳动教养制度的终结,对我国的司法环境产生了深刻的影响。
为该研究报告提供数据支持的国双科技收集汇总了在2014年在各个主流网络媒体上所发表的围绕最高人民法院的三万余篇新闻报道,通过其自主研发的自然语言处理、机器学习和大规模并行数据仓库等技术对报道中提及的主题进行了识别、抽取、聚合和排序,最终挑选出与最高人民法院工作内容最相关的以上十个关键词。
专家指出,大数据这个词汇出现在公众视线里已经有一段时间了。随着计算、存储和网络通信的能力提升和成本降低,越来越多的机器数据、行为数据、特征数据以及一些非结构化数据开始被用来进行分析,以发掘其中潜在的价值。在一些行业如互联网行业,由于天然的离数据更近、对数据友好,因而在大数据方面有更广泛和有效的应用。而在法律行业,由于大部分数据都是以书面文字的形态记录和存储,在未经加工的情况下难以直接被计算机很好地理解,因而相关方面的研究其实只是刚刚起步。
专家认为,有一点可以肯定的是,计算机和大数据可能会迅速更新我们对周围所处司法环境的认识:从小而言,我们可能会知道人们都会因为什么原因打官司,请什么样的律师更有可能打赢官司,打官司的时候应该注意哪些证据、采用哪种思路;从大而言,我们可能会知道哪些纠纷在适用法律时经常会出差错或标准不一致,哪些案件目前缺乏相应的法律法规进行调整……大数据的精髓,在于发现数据中客观存在但又易被忽视的内在规律,并引导我们进一步理解这些规律产生的原因。尽管目前还没有这种超级计算机出现,但目前的技术水平已经足够支撑我们在法律领域利用大数据技术做一些初步的探索和研究。