https://mp.weixin.qq.com/s/coeUOIECqxCZz_Qun9v-5w


作为一名数据分析师,王伙明主要负责非税收入票据的数据深度挖掘与分析等工作,紧密对接财政端相关要求和卫健委各项数据处理需求,确保信息准确无误且高效响应。在工作中,王伙明是一名标准的“IT男”,喜欢钻研,总想着有没有更好、更优的解决方案,他坦言:“相较于单纯的重复性工作,我更倾向于主动创新,不断寻求突破和改变”。
去年暑假的时候,王伙明的部门新进两名清华大学的实习生,他们主要来学习和处理NLP(自然语言处理)相关的工作。王伙明发现他们通过GPT3来构造训练用的问答语料,效果相当不错,随即产生了深入研究大语言模型的想法。经过一番调研和测试,他发现大语言模型最容易被应用的地方就是在智能客服的构建上,于是开始尝试基于外部数据库构建比较简易的智能客服模型。
从无到有的过程并不是一帆风顺的,王伙明回忆:“因为是头一次接触大语言模型的相关技术,之前大部分时候都是把它当成一个搜索引擎在用。相对于直接引用openai的接口,在私有化部署上会遇到很多环境问题,一些模型的使用都需要重新修改源码,有些可以找的相关文档,有些只能直接硬着头皮自己摸索着修改。”
智能客服模型是基于国产开源大语言模型通义千问1.5-7b版本和langchain框架结合构建的。通过将财政领域相关的语料向量化并存储在向量数据库中,用户提问时模型会检索和问题最相关的一些语料返回给大语言模型,模型整理回答给用户。整体用的是RAG(检索增强)的方法,相对于微调的方法,模型不会产生幻觉(不会说一些敏感话语)、资源要求也相对较低(不需要微调训练)。智能客服模型极大地优化了用户体验,提升了服务效能,表现出了人工智能在提升财务管理智能化服务水平方面的巨大潜力与实际价值。
当下,全国上下都在加快发展新质生产力,这就要求创新必须起主导作用。作为一名数字技术研发人员,王伙明对创新有着自己的理解,“在生活和工作中,我深刻认识到,一成不变的重复性工作虽然能够带来稳定性和熟练度的提升,但主动创新却能带来更大的突破和进步。我喜欢挑战现状,寻找改进的空间,享受从无到有创造价值的过程。通过创新,我们可以解决传统方法难以攻克的问题,推动社会和技术的进步,也能激发个人的成长和潜能。”

除了创新构建智能客服模型外,王伙明还创新提出基于机器学习模型对财政可疑票据进行深度检测,对比以往单纯通过固定规则扫描的方式提高了准确率及覆盖率;参与博思和清华大学顶尖团队的合作项目,共同致力于对大规模语言模型进行定制化微调的数据架构设计与建设工作,提升了模型在特定业务场景下的应用效能。“通过这样的多元工作内容,在数据分析、技术研发以及跨团队协作等方面,我能够发挥专业价值,和团队一起创新,为客户创造价值,我很高兴。”王伙明说。
问及荣获集团“创新之星”的感想时,王伙明表示:“这份荣誉不仅是对我个人在创新工作上付出努力的认可,更是对我所在团队协作精神与集体智慧的肯定。展望未来,我更要秉持锐意进取的精神,不断开拓创新,用实际行动回馈集团的信任和客户的期待,也希望能和更多同事一起创新,享受创造的快乐!”
创新始终是博思软件发展的核心动力。王伙明是集团一大批热爱创新、忠于创造的博思人的缩影。他们用一次次尝试、一次次突破,写就博思创新发展之路。创新不止,探索不息!博思团队将以持续创新,为用户提供更加便捷、高效以及更具价值的服务。




