.:. 草榴社區 » 技術討論區 » 核酸结果统计难?复旦博士生的操作火了[5P]
本頁主題: 核酸结果统计难?复旦博士生的操作火了[5P]字體大小 寬屏顯示 只看樓主 最新點評 熱門評論 時間順序
【我爱罗】


級別:風雲使者 ( 13 )
發帖:2782
威望:3346 點
金錢:37701805 USD
貢獻:202216 點
註冊:2006-12-30
認證: 技術區認證會員
2022-11-03

核酸结果统计难?复旦博士生的操作火了[5P]


人工核查核酸报告费时费力又易出错,怎么办?
4 月 7 日,复旦大学官微发文,自 3 月初以来,学校启动常态化核酸筛查工作,要求班级辅导员必须核查学生 " 健康云 " 核酸完成截图,确保 " 不漏一人 "。
学校信息科学与工程学院博士生李小康的操作火了,几分钟就能快速核查数百人的核酸完成截图,大大提高核查效率和精度!

 


从 1 小时到 2 分钟,一串代码搞定
据了解,李小康目前担任学院 2019 级信息 1 班辅导员。
对于核查核酸报告的工作,他表示:" 听起来好像很简单,但实际做的时候,一个班级的截图可能就需要花上半小时核查,如果是人数多的院系可能需要更久,还可能会看错看漏。"

 


李小康正在做志愿者
作为生物医学工程专业博士生,他的研究方向是医学影像与人工智能,平常会接触很多图像处理方法。李小康第一时间想到以前学到过的 OCR (Optical Character Recognition,光学字符识别)技术。
"OCR 可以把图像中的文字识别出来,转换为文本信息,就方便用来核查了。而且因为核酸截图是打印字体,识别率非常高,几乎可以做到 100% 准确。"
他还想到了 Python 语言中的正则表达式——可以搜索到字符串中的特定模式内容。
" 使用正则表达式就可以把想要的信息从 OCR 识别的文本中筛选出来。最后,确认好每张截图里的姓名、检测时间和是否已采样等信息后,再把所有人的结果输出到 Excel 文件中,方便人工确认。"
最后,李小康确定了 "OCR 文字识别 + 正则表达式筛选 " 的程序思路。3 月 15 日晚,他花了一个多小时就写出了初始代码,共 130 行,发现确实能够跑通,且运行效率很高。

 


李小康最初写程序时和学工同事的聊天
程序一写好,李小康就在自己班级的核酸截图数据上进行验证,准确率果然很高,甚至检测出了之前人工核查没有发现的问题。并且,程序运行时间很短,80 多张图只需要 20 多秒。
复旦大学:有望全校覆盖
目前,程序已在该学院服务两周。李小康曾让别的老师试用自己的程序进行核查。800 幅截图,原来要几个人核对一个多小时,现在只需等 2 分钟就拿到结果。

 


他把这件事发到朋友圈之后,不少同事表示很感兴趣,他还把代码分享了出去。为了方便不会编程的老师使用,李小康最后还把程序进行了封装——用的时候,只要在命令行输入一行代码就可以运行。

 


程序输出的 Excel 文件
据了解,学校信息办也与李小康进行了对接。预计在不久的将来,师生们就可不用再手动收集核酸截图,而是通过小程序直接上传图片,就可在后台随时查看统计结果。

 


 


 


 


4 月 7 日下午,记者与李小康取得联系时,他正在学校楼栋担任志愿者送饭。
他说过:" 原理也很简单,只要是会写代码的人第一时间就会明白是怎么回事,但是不做相关工作的感受不到这件事情的费时费力,自然也不会想出办法。我只是用我学到的知识解决实际工作中的困难。"
用所学贡献青春力量!


赞(17)
------------------------
6

DMCA / ABUSE REPORT | TOP Posted: 04-08 17:33 發表評論
.:. 草榴社區 » 技術討論區


電腦版 手機版 客戶端 DMCA
用時 0.01(s) x3, 09-20 09:04