本研发项目由育成中心下设的创新信息中心负责技术开发,主要将构建一个基于大数据的专利信息分析订制系统,用户在该系统客户端浏览后台数据库中专利信息的过程中,系统会自动保存用户的浏览记录,用户离线后,系统对存储于云平台中用户的浏览内容和浏览习惯进行挖掘分析,对用户可能感兴趣的专利进行预测,以便在用户再次登录时进行推荐。系统的推荐方向主要分为基于专利特征的协同过滤推荐和基于用户浏览相关性的协同过滤推荐两大类,具体的研究也分为两个方向,基于专利特征的协同过滤推荐首先需要得到专利之间相似度,把与用户浏览过的专利相似的专利推荐给用户;基于用户浏览相关性的协同过滤则需要计算用户与用户之间的相似度,把两个相似度高的用户视作兴趣相同的人,系统则把相似度高的用户浏览的专利推荐给彼此。该项目的关键在大数据应用背景下的文本分类和推荐。传统串行的分类和推荐主要针对小数据集,而面对数据库存放的百万数据规模,如何高效地建立专利相似表和用户行为相似表,并准确地完成分类和推荐是项目技术的关键所在。
本研发项目计划2016年底建设完成后,将对专利及其用户数据进行整合和分析,根据用户特点及喜好进行信息过滤,提高用户信息获取效率,同时,将专利智能地推送给潜在的用户,有助于用户及时获取到需要的信息,解决技术对接、技术研发中信息不对称等问题,将为德阳市专利的创造运用、保护管理等工作提供服务支撑,促进专利信息在创新主体间的流动、共享,推动专利技术产业化发展,促进德阳市科学研究与生产应用的有机结合, 推动德阳产业技术的创新发展,具有极大的市场需求和经济价值。