xml地图|网站地图|网站标签 [设为首页] [加入收藏]
您的位置:威尼斯平台 > 古典文学 > 大数据环境下古代文学教学改革刍议,大数据时

大数据环境下古代文学教学改革刍议,大数据时

2020-01-31 14:41

您现在的位置:公务员期刊网>>论文范文>>文学论文>>古代文学论文>>正文

威尼斯网投官方网站 1

大数据环境下古代文学教学改革刍议

摘要:近几年来,古籍数字化、古诗词数据库的研发不仅为古代文学的研究带来了帮助,也为古代文学的教学带来了一定的影响。从作家作品分析、文学发展的讲解以及课程作业的设计三个方面,探讨在大数据环境下如何有效运用巨量资料、数据库等资源,采用数据统计分析的方法和手段来提升古代文学的教学质量,培养学生的专业素质与文学修养。关键词:大数据;古代文学;教学在我国高校人文学科领域中,古代文学课程有着非常重要的作用,它不仅是汉语言文学专业的核心课程,也是其他人文学科诸如国际汉语教育、戏剧与影视文学、文秘、新闻、广告等专业的专业基础课。然而学界当下对于古代文学教学的现状并不满意,对古代文学教学中存在的问题有较为充分的认识和探讨[1-3]。正如戴建业教授《大学中文系古代文学教学现状与反思》所言,“多年来,各大学中文系古代文学教学,主要是通过‘中国文学史’课程完成的,教师较多在课堂上向学生讲授一长串线索,一大堆概念,一大批作家,古代文学中的许多经典名篇,学生却读得不多,也较少求甚解,更不可能去涵泳。这种教法与学法类似于一种‘买椟还珠’的现代版。”[4]尽管现在很多学校汉语言专业分别开设了中国古代文学史和古代文学作品选读等课程,但在具体的讲授中往往仍然是以时间为线索讲背景谈概念,而很少对作品进行解读,更不用谈情感的体验和审美的感受了。对于大多数没有接受过古诗词训练的大学生而言,走马观花式的作品讲解、简单粗略的作家介绍、文学现象的概念式总结,都很难激发学生学习的兴趣。这样的教学模式导致学生为了应付考试而死记硬背一些概念名词,并不能从实际上真正提高其专业修养和人文素养。2011年,麦肯锡在《大数据:创新、竞争和生产力的下一个新领域》的研究报告中,正式提出了“大数据”一词。随后,这一话题不仅成了计算机行业内的热门话题,也引起了各行各业的广泛热议。对“大数据”这一概念,人们从不同的角度提出了不同的理解,人们普遍认为大数据即海量数据、巨量资料。更有学者认为,“大数据超越了海量数据的含义,它描述的是随着数据量和数据类型激增而逐渐衍生出来的一种现象,不仅包括大规模、多样化的数据集,还包括对这种数据集进行高速采集、处理与分析以提取价值的技术架构与技术过程。”[5]从数据的角度看,大数据的特征被概括为4V,即数据量大、数据类型多、速度快。基于以上特点,大数据在社会生活中的应用越来越广泛,在教育部颁发的《教育信息化十年发展规划》的指导下,我国高校也越来越重视信息化教学。在这一背景下,古代文学教学中相关问题,如作家作品的分析、文学发展历程、作业的设计等,也可以从多个方面做适当调整,以期进一步提高教学质量。一、关于作家作品的分析传统的古代文学教学模式在讲授具体作家时,对其生平事迹往往按照时间顺序进行串讲,何年中举、何年入仕、何年升降,以及这一时期的文学思想与诗文创作等,这种平直的简介往往不能给学生留下深刻印象。关于作品的讲解,由于课堂时间有限,教师不能对作品做详细的解读,只能走马观花粗略鉴赏;学生大体疏通文意,虽体会了诗文字面的含义,但常常是不求甚解,至于诗境、文心,因为缺乏对诗文创作背景、时代环境等的了解,难以有情感的体验,没有情感的浸润,也就难以有审美的体验。王兆鹏教授《唐宋文学编年系地信息平台》的建设,为古代文学教学中有关作家作品的讲解提供了一个新的思路。王兆鹏教授与搜韵诗词共同打造的《唐宋文学编年系地信息平台》,通过将现有的唐宋作家作品编年信息录入数据库进行数字化处理后,与当代、历史地图进行整合,利用GIS技术开发了以地图为平台的信息系统。进入平台后,随意点击地图中的某一地名,就可以看到唐宋哪些文人曾在此停留并留下了哪些篇章;从平台的诗人列表中点击某一诗人的名字,其一生行迹路线图清晰可见。路线图和文字说明相结合,更便于人们直观地了解一个文人的生平轨迹和具体创作。这一信息平台很好地实现了时空维度的交融,而这正是我们在教学中经常忽视的问题。以苏轼为例,按照现有古代文学史的教材来讲解,大多是先讲苏轼的生平、人生观、创作道路、创作思想,然后以分体的形式讲解其文、诗、词创作等。这样就把作家、作品一分为二地进行讲解,学生所接收的信息是颇为概念化的。由于模糊了时空的问题,给学生的印象就是苏轼其人很旷达、苏轼诗文风格豪迈,而忽视了苏轼文学创作中兼收并蓄的特点。鉴于大数据的丰富资料,在讲解苏轼时我们不妨换个思路,将其人生轨迹与文学创作历程同时进行考察。首先,借助于北宋行政区划图大致拟定其人生轨迹,嘉祐元年三月苏轼兄弟随父亲离家赶赴汴京参加进士考试,及第同年即丁忧家居。到嘉祐四年十月,父子三人再度赴京,三人一路唱和编成《南行集》,这是现存苏轼诗歌中最早的一批作品,可以看作是他诗歌创作的起点。其次,从嘉祐六年,以组诗《凤翔八观》为代表的古体诗,关心国事、反映民生疾苦,艺术上也渐趋成熟。熙宁四年苏轼到达杭州,任通判,杭州的秀丽山水给诗人带来了极大的创作热情,苏轼描写西湖的诗作已经成为家喻户晓的名句。从苏轼词集来看,他也是从这一时期才开始填词的。再次,熙宁七年,任密州知州,这一时期词的创作有重大发展,初步形成了豪放词风,代表作有《江城子•密州出猎》《水调歌头•明月几时有》……。在时空的交汇中梳理苏轼的文学创作,黄州、惠州、儋州时期的创作高峰,在京为官时的创作低潮,都清晰地展现了其诗文创作的动态变化。而通过这一变化,更利于学生深入认识、体会苏轼文学风格的特点及形成过程,这较之单纯地讲解、总结,学生的学习热情和学习效果肯定会有所提升。在大数据背景下,借助众多数据和新媒体,这一教学方式得以轻松实现。二、关于文学发展历程的讲解“一代有一代之文学”[6]的观念自明代就得到了许多学者的认同,从文体的演变来看文学的发展是中国古代文学教学中经常用到的方法。楚骚、汉赋、唐诗、宋诗,通过对文体序列的排位来总结文学发展概况,这就容易给学生一个错误的引导,提及汉代,只重视赋;论及唐代,只谈诗歌。对于学生而言,这样的教学其实不利于他们对文学发展有一个全面的认识,反而容易进入一个狭隘的学习视野。文学的发展有时间的跨度,文体的完备也需要一定的时间,今天我们回顾古代文学的发展,虽然具备了对文学体裁进行总结的条件,然而在教学中一味强调“一代有一代之文学”,并在教学实践中遵循前人“只重视唐诗、宋词、元曲讲解”的做法,不利于学生真正全面认识文学的发展。以宋代文学为例,一直以来宋词作为宋代的代表性文体得到了学界的广泛重视,在教学中也一直是教学的重点,长期以来这似乎已经是一种共识。然而在大数据环境下,随着越来越多的古代文学作品数据库的建立,对宋代文学的发展似乎也应有一个新的判断。“古今文章,至我宋集大成矣。”[7]“宋之文超汉轶唐,粹然为一王法。”[8]宋人对宋文的发展不仅有着较为自觉的理论认识,而且是颇为骄傲与自豪的。客观讲,宋文所取得的成就并不逊于宋词,但长期以来,在宋代文学的教学中,宋文往往是在古文运动中简单讲述,学生也很难对此有深入的认识。就当下对宋文的整理来看,已经出版的《全宋文》计360册,收录近万人的17万余篇作品。虽不能以量的多少来讨论文学成就的高下,但如此丰富的文学遗产显然是今人所不能忽视的。而且随着全宋文数据库的编制,为我们全面认识宋文提供了极大的便利。借助数据库的搜索引擎,在教学中可以更好地展示宋文的发展及其所形成的文学特色、所取得的文学成就。如此一来,就不至于给学生留下宋代文学仅仅是宋词成就斐然的刻板印象了。明清文学更是如此,长期以来在教学中重小说轻诗文的现象非常严重;随着古籍的整理以及当下众多古诗词数据库的研发,明清诗文也逐渐引起人们越来越多的关注,因此在本科教学中也应有所体现。众多的古诗词数据库提供了较为全面的经典古诗词和古诗文,并且这些数据库大多提供检索分析,具有一定的智能化特点。文学内容的演变是文学发展的具体表现,文学作品也是文人对特定时代社会生活的审美反映,同一题材在不同时期所反映的不同主题就很好地呈现了文学的发展。借助于众多古典文学数据库,对不同时代同类题材的文学作品进行分析得以轻松实现。文学发展中文学形式的演进、继承与革新等相关话题借助于当下的古籍数据库都有了新的教学思路,通过数据分析进行相关知识的讲解,更利于学生的理解与接受。三、关于作业的设计作业设计是教学的一个重要环节,而课程作业作为课堂学习的延续,既是学生进行独立学习的活动,也是学生学习过程中的重要内容。当下古代文学教学在作业设计上也存在着一定的问题,大体表现在:作业形式单一;作业内容简单化,在问与答中难以调动学生的兴趣;作业评价与反馈效果不明显等,而且这些问题长期以来在教学中都未能引起足够的重视。在大数据背景下,海量资料、数据挖掘技术、多维检索方式等丰富了古代文学教学中的作业设计。以杜甫为例,传统的古文学教学中,关于“杜甫”的作业设计常常是“杜甫诗歌的‘诗史’性质”;“杜甫诗歌的艺术风格”;“杜甫诗歌的叙事手法”;“杜诗的地位与影响”等等,这些问题的设计都过于概念化,未能体现个性化,也难以激发学生的学习兴趣。而在大数据背景下,有了大量可供利用的信息资料,在揣摩教材与掌握学生学习的实际情况的前提下,可以精心设计多种形式的古代文学作业。就杜甫而言,对于汉语言专业的学生,根据其专业要求,可以借助数据库设计一些较为深入的研究型作业,比如可以布置“通过安史之乱中杜甫的行迹与创作的数据分析,理解杜诗的‘诗史’性质”,以及“通过对古诗词数据库的分析来解构后人对杜甫的评价以及杜甫的影响”等。因为有数据与材料的支撑,这较之简单的对杜诗“诗史”性质的平铺直叙,更容易加深学生的认识与理解,而且完成这一作业的本身就是较为有趣的探索过程。古诗词数据库大多都有检索功能,如北京大学李铎教授主持研发的《〈全宋诗〉分析系统》就提供多维的检索分析方式,学生可以借助这些数据库进行检索,搜集后世有关杜诗评价的诗文,然后进行分析归纳,通过数据分析发现问题。对于非汉语言专业的学生还可以联系其专业特点布置作业,比如对于新闻学专业的学生,可以布置“题壁诗与传播”“宋词中的传播方式”“笔记小说中的新闻传播”等;对于文秘专业的学生,可以布置“笔记小说中文秘形象的书写”等;对于广告专业的学生可以布置“古代名人在当下的品牌价值”等。这些作业都需要学生通过搜集大量的信息与资料后进行数据的统计与分析完成,其结论的获得印象也就较为深刻。这较之传统教学模式中的作业布置,其评价效果也较为明显,学生是否理解、掌握了这一问题在作业中会有着清晰的体现。四、大数据背景下古代文学教学前景展望由近些年来,我国古籍数字化工作取得了显着的成绩,常用的古诗词数据库,如由北京大学数据分析研究中心和北京欣诺格科技有限公司联合研制的《全唐诗分析系统》与《全宋诗分析系统》、郑州大学《全唐诗库》、稻香居“全唐诗宋全词在线检索”等,这些数据库不仅仅提供检索功能,更重视数据的分析。如《全唐诗分析系统》与《全宋诗分析系统》在重出诗提取、格律诗标注、字及字组的频率分布统计等都带有智能化的特点,其多维的检索分析方式有利于可靠的数据发掘。王兆鹏教授与搜韵诗词共同打造的《唐宋文学编年系地信息平台》在这方面更是有了进一步发展。显然,在大数据环境下资料的获得相对来说容易了很多,在具体的教学中,无论是作家作品的讲解、文学发展的梳理还是课程作业的设计,都可借助于巨量资料、数据分析的便利,真正实现以文学作品为本位的教学模式。仍以苏轼为例,通过众多的古诗词数据库,将其人生行迹与文学创作历程相联系,学生可以对其文学创作的动态变化有一个清晰的认识,这样苏轼文学风格的形成、文学成就的获得也就自然明了了。同样,借助于古诗词数据库,围绕苏轼对其同时代文人的创作进行梳理,那么,关于词中“以诗为词”“婉约派”“豪放派”等相关问题的探讨也就迎刃而解了。无论是课堂教学还是课程作业的设计,大数据环境下古代文学教学改革有了切实可行的路径。而且在这种教学模式下,学生的学习主动性得以真正地调动起来。无论是带着问题对作品进行分析,还是在对作品的分析中发现问题,学生在探讨的过程中因为对作品了解的深入,也就不难获得情感的体验及审美的感受,这对提高其鉴赏能力和专业素养是大有裨益的。综上所述,古籍数字化、古诗词数据库的研发不仅为学者的研究带来了极大的便利,也为高校古代文学教学工作带来了更多的生机。首先,多种形式的古籍数据库丰富了课堂教学的内容,有利于调动学生情绪,活跃课堂气氛。其次,众多的古诗词数据库为学生爬梳材料、探究问题带来了丰富的资源,有利于培养学生的问题意识、科研能力。再次,大多数据库虽重数据分析,但对于古诗词数据库而言,分析结论的获得是建立在文学作品的基础上,这又有利于让古代文学的教学重回文学本位,以文学作品为本。参考文献:[1]熊笃.古代文学教学现状及教改刍议[J].高等师范教育研究,1994:77-78.[2]刘鹤岩.关于高校古代文学教学的思考[J].中国社会科学院研究生院学报,2004:137-139.[3]孙小力.中国古代文学教学存在的问题和改革设想[J].中国大学教学,2007:43-46.[4]戴建业.大学中文系古代文学教学现状与反思[J].华中师范大学学报:84作者:操瑞文 单位:1.淮北师范大学 2.山东大学

阅读次数:人次

编者按

对人文学者来说,作为工具的计算机,已从文献检索时代进入到数据分析时代。计算机不仅能帮助我们从海量文献中快速检索到所需的资料,还能以数据为基础帮助我们发现问题和分析问题。随着数字人文技术的发展,数据分析的技术和方法越来越有针对性和强效性,能清晰地揭示隐藏在文学史背后的作家与社会之间、作家与作家之间、文本与文本之间的直接与间接、显性与隐性的多种关联,能以全知型的视角系统整体地还原和呈现文学史的立体景观,改变传统的思维方式和文学研究范式。

目前的中国古代文学研究,在数据分析方面虽然已经起步,但还没有完全跟上数字人文的发展步伐,可用于统计分析的关系型文学数据库建设还比较薄弱,适用于古代文学研究的分析工具、分析方法、分析模型还相当有限。近些年学界和业界推出了相当丰富的数字化的文献资源库,如《中国基本古籍库》《中华经典古籍库》等,但主要用于检索,还不是结构化的能进行统计分析和再生知识的数据库。运用数字人文的分析工具和技术方法来研究古代文学,也取得了一定的实绩,但还处在尝试性阶段,未成规模,影响不大。

为推进数字人文技术在古代文学研究中的应用与突破,本期约请清华大学中国古典文献研究中心数字人文研究团队的刘石、孙茂松、张力伟和刘京臣四位先生从不同的角度笔谈他们的构想和规划。刘石、孙茂松先生构建了古典文学研究的分析模型,刘京臣先生阐述了基于社会网络分析的文本与人物研究的理路,既有理论的前瞻性,也有方法的可操作性;张力伟先生提出了建设“中国古典知识库”的宏大构想,令人期待!

20世纪60年代,电脑就被西方国家运用于人文学科研究,称为“人文计算”。美、英、法、德等国利用大数据技术研究文学开展得早、影响大,相继成立了国家级项目组或研究中心,致力于莎士比亚戏剧、法国中世纪诗歌等多语种文学经典的内容分析,产生了一批引人注目的理论着述与应用成果。

进入新世纪,一些研究机构及企业开始对书籍进行大规模数据化。谷歌与哈佛大学共同研发的数据库可对1600年至2000年间出版的500多万册书籍的单词和短语的使用频率进行统计,通过关键词使用频率的变化,可以崭新的视角揭示500年来人类文化发展史的总体趋势。伴随人工智能技术的进步,机器的深度学习在文本分析方面展现了惊人效率。《布谷鸟的呼唤》原是《哈利·波特》的作者J. K. 罗琳于2013年匿名发表的小说。牛津大学的Peter Millican和杜肯大学的Patrick Juola运用法律语言学的分析方法对比分析,推测它很可能是罗琳的新作,最后,罗琳承认这部小说确出己手。

国内在20世纪80年代也出现了“人文计算应用”的概念,一些学者开始致力于运用电脑技术研究人文课题。早期对古典文学尤其诗词的研究多为计算机或统计专业的学者。厦门大学周昌乐教授课题组针对宋词风格“豪放与婉约”的分类问题,研创了基于字和词为特征的风格分类模型、基于频繁关键字共现的诗歌风格判定方法以及基于词和语义为特征的风格分类模型。首都师范大学尹小林教授最早研发了“《全唐诗》检索系统”,北京大学李铎教授也研发了“《全宋诗》分析系统”“《全唐诗》分析系统”“《资治通鉴》分析系统”等。北京大学杜晓勤教授研发的“中国古典诗文声律分析系统”首次实现对中国古典诗歌及有关韵文进行批量四声自动标注和八病标识、数据统计功能,不仅有助于研究永明体诗歌的声病情况,还可考察永明诗律向近体诗律演变的环节和过程。中南民族大学王兆鹏教授是较早采用量化分析研究古代文学经典的专家,他先后主持了“中国古代诗歌史的计量分析”“20世纪唐五代文学研究论着目录检索系统与定量分析”等多个项目,尤其是唐宋诗词名篇的定量分析及国家社科重大项目“唐宋文学编年系地信息平台”引发了社会的普遍关注。

郑永晓先生数年前已经呼吁古典文学研究从数字化向数据化的转变。基于大数据技术对古代文学经典文本进行高效和深度分析,可将文学研究纳入到一个更宏观的视野,提高研究结论的精准性、稳定性及可验证性,促生新的研究理念、方法与范式。但总体来看,古典文学研究领域目前还基本处在古籍数字化、数字化检索和少数专题数据平台建设阶段。

现阶段数字人文研究的主要技术方法,包括机器学习与人工智能、数据库建设、计算语言学、社会网络与地理信息系统、数据与文本挖掘等方面。这些技术方法可分别用于古典诗歌分析系统的尝试、作家生平事迹研究、古典小说研究、文本与人物研究、文体与文论研究,涵盖了古典文学研究的主要方面。

基于这样的理解,我们拟以先秦至明清品类纷繁的古代文学经典文本为中心,利用计算机、统计学、信息科学等学科的新兴技术手段,形成如右上图所示的研究结构。

威尼斯网投官方网站,研究的流程是文学专家提出问题——技术专家设计算法模型——借助知识库或数据库等平台进行文本分析——文学专家对分析结果进行解析和研究。数据库建设、技术创新运用与文本研究三位一体。数据库是基础,文本分析技术是关键,最终要落实到发掘依靠阅读经验难以发现的文本组织特征及相互关系,通过定量统计、定性分析,解决古典文学研究领域长期存在的疑而难决的作品归属、作品辨伪、异文辨析、修辞特色、风格生成、题材变迁、因革影响等方面的问题,期望在以下诸方向有所推进:

1.重新验证已有成说的经典史论问题。比如,提出“文必秦汉,诗必盛唐”的明代前后七子为代表的文人群体,其诗文创作是否落实和如何落实其文学创作的主张?利用共词分析、语义分析、人物事件交杂等技术思路,尝试全新分析和解决诸如文体形式、社团流派、人物关系、情节演进、阶段特征、历史影响等问题。

2.解决人力难以彻底解决的疑难问题,为作品归属、重出异文、改编续写、风格流派、文类划分等提供新的证据、思路与方法。如唐宋诗“体格性分之殊”的判断,诗词曲三种相近文类格律、用韵、题材、语词、典故、句法、意象、风格的穷尽性统计,为定性分析提供数据支撑,可以提高研究结论的精确性、稳定性及可验证性。

3.超越主观感受与印象分析层面,科学梳理文学史长时段中存在的特征、规律、关联性问题。比如陆游诗近万首,词自中唐产生而历经各代,他或它们的题材、修辞、风格变化轨迹究竟如何,数者之间的关系怎样?通过对一个作家或一类作品的“深度学习”,发挥其文本比对、关联分析等技术优势,追踪挖掘以往不曾注意到的迹象或线索,以期提高文学经典研究的可靠性与科学性。

利用大数据技术研究中国古代文学,对学术发展和学科建设的意义是明显的,特别体现在研究范式与思维方式的革新。

傅斯年认为,“凡一种学问能扩张他所研究的材料便进步,不能的便退步”。大数据技术可以实现相关研究史料的全覆盖,是对以往研究资料的极大扩充。目前研究中普遍存在的检索依赖会造成史料的类型遮蔽,特别是反证材料的遮蔽。检索依赖也会导致对史料的解读脱离历史语境,无数孤零零的没有历史气息的材料断片的组合,无法反映真实的历史场域中的问题。文学研究者接受的信息如果是非全息的,文史研究的科学性和有效性必然值得怀疑。全数据分析模式抛弃了随机性的样本研究模式,让研究者具有“上帝视角”,重视对事情整体系统的感知,又强调基于全数据的细节化,提高认知的精确度,是一种理想的学术研究模式。

传统的文献材料彼此间基本上呈现出相对明显的线性关系,可以找到前因后果,进而形成相对完整和自洽的因果链。大数据时代面对的只是具有相关性的海量数据,几乎不可能找到每个数据的微观因果链,如果坚持因果路径,将陷入无穷无尽的因果关系之中而茫然无措。因此,大数据时代不必非得知道现象背后的原因,而是让数据自己发声。对思想、情感和艺术为主体的古典文学学科而言,强调差异性、变异性和独特性的相关性分析方法比因果性分析方法可能具有更强的裁断力。

大数据技术的兴起,使数据采集、存储和处理极大地智能化、自动化。“全数据模式”将与问题相关的数据一网打尽,最大限度地摆脱客观条件局限造成的以局部论全部,问题可以得到更系统、更全面、更整体的刻画,从而得到更精确、更彻底的解决。这是数据化带来的一种严格意义上的整体论,将使思维方式从还原性思维走向整体性思维。

历史与逻辑、事实与价值的统一是人文社科研究的基本方法,大数据时代的研究尊重全体材料、重视量化分析和兼顾所有关系,这将有助于促进人文学科的研究由“解释性”向“求是性”转向。随着人的思想、情感、心理的数据化,人文学科的研究对象也能够实现数据化,可以通过数据挖掘、数据分析和数据建模来进行研究,这样人文学科也就由以往被认作非科学的学科跻身于科学成员的大家庭中,进而发展出人文科学。

总之,大数据思维为人文社科研究的变革与创新带来了千载难逢的历史机遇,正如美国康奈尔大学教授杰弗里·汉考克所说:“这是社科研究的一个全新时代,就好比显微镜的诞生对化学科学发展所起到的促进作用。”

需要指出的是,古典文学研究中新技术手段的应用需要充分依靠计算机科学和统计学的专业技术,在尚缺乏此类技术力量的今天,必然会促进学术研究人力资源的整合,倒逼跨学科合作研究的开展。但文学性问题的提出和分析处理不可能完全交给机器,也就不可能完全交给技术专家。相反,从问题的设置到语料的选取再到分析结果的解读、意义的阐释、体系的建构等,都将由古代文学和文献学相关领域高水平的专家学者完成。

(作者:刘石,系清华大学人文学院教授;孙茂松,系清华大学计算机科学与技术系教授)

本文由威尼斯平台发布于古典文学,转载请注明出处:大数据环境下古代文学教学改革刍议,大数据时

关键词: