离高考完全自动化阅卷还有多远? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
gainsurier
V2EX    奇思妙想

离高考完全自动化阅卷还有多远?

  •  
  •   gainsurier 2020-05-14 14:16:14 +08:00 6654 次点击
    这是一个创建于 1981 天前的主题,其中的信息可能已经有所发展或是发生改变。
    现在依靠答题卡的客观题自动化阅卷除了英语听力部分已经几十年没有进步了。

    抛去 OCR 部分,假如完全使用机器答题,所有输入都是文本。
    理工科的填空题,latex 格式描述 现有技术可以做到
    理工科的应用题,某种编程语言描述 现有技术可以做到
    文科的作文和主管题,自然语言编译器 还有很远的距离
    56 条回复    2020-05-17 11:50:38 +08:00
    npe
        1
    npe  
       2020-05-14 14:23:32 +08:00
    手写的汉字千姿百态,OCR 识别难度太高,还没到自然语言那一步就已经“卡”死了。。
    tfdetang
        2
    tfdetang  
       2020-05-14 14:38:47 +08:00
    其实 OCR 的部分倒不一定是最难解决的部分;

    对于证明题,除非出题人已经知道所有解题、证明路径并编码化,不然靠 AI 是不可能阅卷的,毕竟 AI 最不擅长的就是逻辑与推理;

    对于解答空间比较小的题目、比如英语填空、阅读理解、生物、历史、地理等填空 / 简答题,自然语言技术应该可以处理;

    对于解答空间比较大的题目,像政治等一些题目,用学生的回答与正确回答的语义匹配相似度,可能可以打分,但可能和人打分会有一些出入

    对于作文(非英语作文), 由于这个答题空间过于大,而且涉及到对语言审美 思维等,估计这个几乎不可能自动阅卷
    fancy111
        3
    fancy111  
       2020-05-14 14:41:40 +08:00
    除了主观题,其他的应该都没问题。
    如果有问题,那就设计出能给机器判定的题目即可。
    wafm
        4
    wafm  
       2020-05-14 14:43:17 +08:00
    你这试错成本也太高了吧,这可是普通人的唯一出路。
    抛开字体不说,大多数主观体你怎么解决?
    像#2 说的都是大问题,依赖机器评分谁服气?

    现在人工阅卷每年都有不服要求重新阅卷的(“我小孩平时成绩都很好的!怎么这么低分?肯定是改错卷了”),如果换做机器那就没完没了。
    daozhihun
        5
    daozhihun  
       2020-05-14 14:45:24 +08:00
    我觉得有一些确实可以自动化。
    比如物理的电路图连线(应该顶多几种标准答案)、一些填空题(处理一下等价的情形即可)等,但其他的,比如数学、物理的应用题,尤其是证明题,我觉得暂时还不现实。
    为了一些特例自动化也没有什么价值,关键高考不能容忍有误差或错误,所以人工看是相对靠谱的。
    lostberryzz
        6
    lostberryzz  
       2020-05-14 14:50:15 +08:00
    还有 50 年
    kop1989
        7
    kop1989  
       2020-05-14 14:53:11 +08:00
    我觉得主观题就不应该自动化阅卷。
    因为主观题除了考验知识点之外,其实还有考验学生的表达能力和与阅卷人之间的交流沟通的能力的目的。

    虽然目前大家为了分高,主观题答题、阅卷也都普遍倾向于程式化。但这并不代表说要剥夺孩子自己组织答题语言的权利。
    一旦进行主观题机器阅卷,那么主观题的答题思路就从给人看,变成了给机器看。长远看对人类的表达不利。
    annet
        8
    annet  
       2020-05-14 14:55:13 +08:00 via Android
    如果非要自动化,应该先电子化考试,单独考书法
    Vegetable
        9
    Vegetable  
       2020-05-14 14:57:55 +08:00
    什么叫自动化阅卷,我们先讨论机器答题好了。
    oppoic
        10
    oppoic  
       2020-05-14 14:59:24 +08:00 via iPhone
    你不知道而已,这条赛道已经有公司创业快 10 年了:七天教育、智学网、云校。。。
    现在能做到的是:客观题自动批阅,英语填空题机器识别自动批阅,主观题切块后保存图片后老师用手机批阅。
    est
        11
    est  
       2020-05-14 15:01:41 +08:00   2
    LZ 的思路是对的。我觉得,不能机器阅卷的试题,不如不考。
    gainsurier
        12
    gainsurier  
    OP
       2020-05-14 15:12:38 +08:00
    @npe 停止手写,直接计试。

    @tfdetang 证明题用编程语言证明,不需要 AI,填空题,英语几乎全是选择题了,简答题和作文实际归为一类用自然语言处理。
    @wafm 现在英语听力不已经全部是机器了,机器评分只不过是时间的问题,要是有谁不服,直接开源评分源代码。

    @daozhihun 可以采取多个打分引擎取平均数,并且部分采样采用人工评分,若偏差过大需要人工审核

    @lostberryzz 围棋当时也认为是几十年

    @kop1989 证明题完全可以用编程语言描述,主观题可以用相对比较严谨的语言描述,那就让语言发展服从机器

    @annet 书法可以抛弃,当成小众爱好。
    @oppoic 自动批阅和答题卡有什么区别
    tabris17
        13
    tabris17  
       2020-05-14 15:14:02 +08:00
    公式识别还凑合,其他嘛……只能说你想多了
    xieyudi2
        14
    xieyudi2  
       2020-05-14 15:21:38 +08:00 via Android
    当年 GRE 作文 CTRL+X 结果来不及 CTRL+V 就时间到了…
    当时真想打开 spy++ 把那个时间到的窗体切到后台…
    Chen332076
        15
    Chen332076  
       2020-05-14 15:24:22 +08:00
    那我也有个问题: 在互联网这么发达的今天,为什么有的公交(即使是北京)还会有人工售票员?
    Nathanzheng
        16
    Nathanzheng  
       2020-05-14 15:28:53 +08:00
    @lostberryzz #6 懂了,可控核聚变之后
    Tianao
        17
    Tianao  
       2020-05-14 15:33:38 +08:00
    我支持适合机考的题型(除了画图之类的)机考、不适合的的扫描,客观题自动化阅卷、主观题人工无纸化阅卷。
    wafm
        18
    wafm  
       2020-05-14 15:46:04 +08:00
    @gainsurier 你试试跟你父母讲一下开源代码。。。
    daozhihun
        19
    daozhihun  
       2020-05-14 15:46:56 +08:00
    @gainsurier 多个引擎取平均,我觉得这个研发的费用会很高哎。。。可能正在研发吧,只是觉得准确度太低或者成本太高暂时还没用
    sugarkeek
        20
    sugarkeek  
       2020-05-14 15:52:42 +08:00
    计算机目前最多作为辅助
    goldenalex
        21
    goldenalex  
       2020-05-14 16:25:28 +08:00
    撇开 ORC 部分。。。

    现在问题就是笔迹和主观题的判断问题。。。

    说远不远,说近不近。。。

    需要大概 2-3 个小突破。。。
    murmur
        22
    murmur  
       2020-05-14 16:31:59 +08:00
    @Chen332076
    1 、解决就业岗位
    2 、接入公交卡和自动计费也是有成本的,可能人家认为找个人省事点
    3 、监督那些不自觉打卡的,虽然没卵用
    4 、给不用公交卡和电子支付人留个后路,分段计费的车费是不固定的,需要找零
    murmur
        23
    murmur  
       2020-05-14 16:34:10 +08:00
    这里就不得不说一下广州跨区公交的设计,如果这个车是 5 快,那你上车就得 5 快,坐一站地也是 5 快,只打卡一次,过了分区点就是 3 快,以此类推,快到站就收 2 快
    libook
        24
    libook  
       2020-05-14 16:34:31 +08:00
    在教育行业工作,个人预测是考试改革肯定会先于自动化阅卷出现,未来的考试模式和考察内容可能会和今日有很大不同,到时候也许完全不可能或不需要自动化阅卷技术了。

    当然考试改革肯定也是一件挺长期的事情;想想素质教育从 80 年代开始搞,到现在才基本落地;教育信息化从 90 年代开始,虽然基础设施早就建设完善了,但相应的实践思想和方法论近五年才逐见雏形。

    但要想彻底解决应试教育问题,核心还是要在招生考试上改革,这个国家近几年的改革力度是可见增大的。
    guojiaxiang
        25
    guojiaxiang  
       2020-05-14 16:42:19 +08:00
    @est 那不成八股文了,全部按照条条框框来
    systemcall
        26
    systemcall  
       2020-05-14 16:51:41 +08:00
    理工科比文科难做
    都要 OCR,作文可以依据 OCR 匹配率+写作模板+关键词过滤来搞,反正大部分人都是照着模板套示例,不按照模板来写的再给人工改,还可以靠卖相关的东西赚钱
    理科不好做,一堆坑不说,OCR 就麻烦得多,写得很潦草的公式你要怎么 OCR?莫名其妙的解题方法你要怎么给分?虽说大部分人也是照着几个模板来套,但是复杂多了,后面的题很多人也套不出来结果,得按照步骤给分。而且排版千奇百怪,你要怎么 OCR ?人工看都要一定的经验才能看懂写的什么东西,还要几个人改才能降低错误率。
    至于填空题,部分题目确实是可以那样搞,但是费力不讨好。还是会有一些不算标答但是是对的的答案,虽然很少,所以还是得有人工。人工改卷一个人只改 1-2 个题,不一定需要降低负载
    Takuron
        27
    Takuron  
       2020-05-14 16:57:11 +08:00 via Android
    不可能,尤其是目前的出题趋势。
    即使是理科,高中很多题都有多种解法,很多解法事前都无法预知是学生自己创造的正确路径。算上大学做法也会给分,错误路径有步骤分,实际情况远比你想的复杂,不然阅卷委员会干什么的?
    如果说要编程,那就不是证明题了,那是算法比赛。
    YUX
        28
    YUX  
    PRO
       2020-05-14 17:09:23 +08:00
    说不可能的大都对人工判主观题的过程过于理想化
    yolee
        29
    yolee  
       2020-05-14 17:30:42 +08:00
    高考这么重要的大事,误判一道题就可能断送了别人的前程,机器能保证 100% 不误判再说
    zuoakang
        30
    zuoakang  
       2020-05-14 17:36:33 +08:00
    为啥不能跟考注会一样,全部上级考试。
    X2031
        31
    X2031  
       2020-05-14 17:40:51 +08:00
    我想到了通过 OCR 实现的注入漏洞
    litanid
        32
    litanid  
       2020-05-14 17:51:11 +08:00 via Android
    我就问你,答题是不是完全电脑上答题,如果不是,电脑能识别千奇百怪的手写体吗
    rb6221
        33
    rb6221  
       2020-05-14 18:06:20 +08:00   4
    你这个问题,我觉得是在颠覆当前的社会体制,真的就有这么严重
    1.平时上课教知识,不是为了那点分数。我就不说很多题目是主观的了,有些学生只答一部分,如果有新的思路冒出来,这是一种进步,那机器怕是要直接把他的创造性按死了。
    2.你可以说下自动化的好处,节省成本?高考这种程度的考试一年也就一次,平时学校里的小考试,真不需要节约那点成本,因为这不仅是对学生的考察,也是对老师判卷水平的考察,本质上也是促进整个师资队伍进步的。
    所以如果真的所有考试都做成自动化了,我认为那才是教育的悲哀
    est
        34
    est  
       2020-05-14 18:12:35 +08:00
    @guojiaxiang 八股文的形式和风格完全没问题。八股文被批判的主要是其「题材」
    aiquit
        35
    aiquit  
       2020-05-14 18:17:04 +08:00
    @janus77 十分赞同
    zmxnv123
        36
    zmxnv123  
       2020-05-14 18:39:21 +08:00
    我在想给这个程序写代码的猿会不会有压力,或者真查出来 bug 怎么处理。
    gggxxxx
        37
    gggxxxx  
       2020-05-14 18:46:32 +08:00 via iPhone
    这完全是思维固化了啊
    折腾这些,不如直接上机考试得了,选择题,加打字输入文字段落.......
    gggxxxx
        38
    gggxxxx  
       2020-05-14 18:48:32 +08:00 via iPhone
    上机考试加上一个面试就完了,大家效率都高
    dinjufen
        39
    dinjufen  
       2020-05-14 18:53:27 +08:00
    客观题可以(判断、选择、填空等有标准答案的),主观题(哪怕是偏主观的)一定不行,即便行,也不能用
    Meltdown
        40
    Meltdown  
       2020-05-14 18:54:40 +08:00 via Android
    感觉推广 ai 的一个重要问题是谁为 AI 的行为后果负责。就像自动驾驶一样,撞死人了谁来负责呢
    KyonLi
        41
    KyonLi  
       2020-05-14 18:55:17 +08:00 via iPhone   1
    我上学那会儿主观题是按关键词给分的,不然没办法量化。同理如果改成上机考试,程序按关键词给分也没差啊
    loading
        42
    loading  
       2020-05-14 20:15:58 +08:00 via Android
    楼主,你写的字是不是和我写的一样,洒脱。
    jedihy
        43
    jedihy  
       2020-05-15 00:07:08 +08:00 via iPhone
    都是选择题就行了,然后语文写个作文
    felixcode
        44
    felixcode  
       2020-05-15 09:47:49 +08:00
    1. 有难度
    2. 风险高
    3. 没必要
    szzhiyang
        45
    szzhiyang  
       2020-05-15 12:04:37 +08:00   1
    有营销号那味儿了。
    no1xsyzy
        46
    no1xsyzy  
       2020-05-15 12:23:24 +08:00   1
    证明题反而是小儿科了,形式化证明的手段在第一阶段 AI 研究专家系统的时候已经玩烂了
    latex 格式描述不靠谱,建议 DSL 。Latex 表示同一个公式有数百种代码天差地别但渲染结果仅仅只有些微差异的写法,不如用 Wolfram Alpha 的形式化。
    不如说理科不是有 Wolfram 在做了吗?还能自动出题,虽然没用过……

    主观题不太可能,除非是某些科目的 “主观” 题。
    训练个模型没问题,但你如何保证其没有在某些位置上发生过拟合或者拟合不足?
    ZehaiZhang
        47
    ZehaiZhang  
       2020-05-15 13:04:43 +08:00
    未来考场:各位考生稍等一下,10 秒钟后出分数
    wangyzj
        48
    wangyzj  
       2020-05-15 13:08:41 +08:00
    真奇思妙想
    Wien
        49
    Wien  
       2020-05-15 13:22:00 +08:00
    退一步讲,我觉得作业自动化批改可行,以后我小孩读书了,真期望能用上水墨屏+自动化批改+错题库等等。减少老师、学生、家长的负担。
    yousabuk
        50
    yousabuk  
       2020-05-15 14:12:51 +08:00
    恐怕比取消高考都远
    cruii
        51
    cruii &nbs;
       2020-05-15 14:42:19 +08:00
    阅卷老师都是尽可能给学生分,而不是扣分,所以有了步骤分这个东西,结果错的,但是依然能拿到该拿的分数
    一个题各个中学的人有不同的思路,有的人巧解(步骤少),有的人硬解(步骤多)。巧解的人的结果错了,那么很可能就是 0 分,硬解的人,结果错了,但是有步骤分。
    靠 AI 这部分就真的太难了。
    nuko
        52
    nuko  
       2020-05-15 15:20:48 +08:00
    如果所有题目都是选择题,判断题,那容易可试卷不止这些
    dingyx99
        53
    dingyx99  
       2020-05-16 10:57:52 +08:00
    考试全部电子化难度非常大。。。你不能让所有人都能熟练掌握 LaTeX,那么考试上又多了一个会不会用 LaTeX 来影响分数的因素
    以及要画图的怎么办?
    dingwen07
        54
    dingwen07  
       2020-05-16 17:07:52 +08:00 via iPhone
    换个方向
    学习 SAT,全部是选择题
    systemcall
        55
    systemcall  
       2020-05-16 18:40:58 +08:00 via Android
    @Wien 估计会用上比 iPad 还贵的瞎眼屏电子垃圾,不指望学校能够采购什么正常的东西,哪怕贵不少如果是个正常的东西也好吧,可是只有老师用的东西的采购是比较正常的,不过也只是相对而言
    自动化批改+错题库,部分高中是在用,但是是扫描答题卡的方式实现的
    改成电子产品,如果不肯出一个可以通用的标准做到真正市场化,就会有很多地方可以钻空子。英语书的录音用了那么多年磁带、书配套的光盘用了那么多年适用于 Windows XP 的 CD-ROM,有一部分原因是怕成那个样子。磁带机和 Windows PC 以及光驱是市场化的,不受一部分人的操控,换成别的东西不好说会怎么样。技术始终只是一部分,话语权在管理层手上
    AX5N
        56
    AX5N  
       2020-05-17 11:50:38 +08:00
    我觉得现在就可以
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2400 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is owered by solitude
    VERSION: 3.9.8.5 28ms UTC 15:45 PVG 23:45 LAX 08:45 JFK 11:45
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86