Education Research Frontier December 2013, Volume 3, Issue 4, PP.194-199
Comparative Research on Chinese and Japanese Reminded Sentences Based on Text Mining ——Emphasis on the Politeness of Wording Liying Mi Department of Foreign Languages, Shanghai University of Finance and Economics, Shanghai, P.R.China Email: mily6903216@gmail.com
Abstract Text mining technology is widely used in market researching, information collection and analysis with respect to the free speeches online. Concerning the fact that text mining technologies vary with the research goals, this paper analyzed systematically the polite words used by Chinese and Japanese students from multidimensional aspects by using data statistical software EXCEL 2013 to extract information, and then Trend Search 2008 was applied to convert the information into a concise data chart; with the aim to discuss the politeness of their words and expressions used by Chinese and Japanese students for reminding their seniors or juniors and to probe the relationship between politeness and region in using polite words and expressions. Keywords: Text Mining; Reminded Sentences; Politeness; Data Chart
基于文本挖掘技术的中日提醒语句的对比研究* ——以措辞的礼貌程度为重点 米丽英 上海财经大学 外语系,上海 中国 摘 要:文本挖掘技术现在主要用于企业的市场调查以及网络上的自由发言的收集及分析。研究目的不同使用的文本挖掘 方法也不同。本文引入文本挖掘技术这一研究方法,使用数据统计软件EXCEL2013对采集来的数据进行信息抽取及对应 分析;并使用Trend Search 2008将其转换成简明的可视化信息数据图表,利用简洁明了的图表对中日大学生提醒语句中 的措辞进行系统的多维度的分析。本文的研究目的有两个,一个为分析中日大学生在提醒长辈及晚辈时,所使用的语言 是否存在礼貌程度的差异?另一个则为考察提醒语句中的礼貌程度是否存在地域差异? 关键词:文本挖掘;中日提醒语句;礼貌程度;数据图表可视化
引言 文本挖掘(Text Mining)是一个从非结构化文本信息中获取用户感兴趣或者有用的模式的过程。通过挖掘和 分析,散布在海量文本当中的隐含知识就可能被拼凑起来,而形成一段完整的、可用的信息[1]。文本挖掘技术 的特点是可以在短时间内完成海量数据的统计,得出各项数据之间的相互关系。由于电子形式的文本信息飞 速增涨,文本挖掘已经成为信息领域的研究热点。本文从研究“礼貌程度”的角度出发,通过文本挖掘技术 来分析中日文中提醒语句的表达特点,包括其提醒方式、语言的构成要素、语气的柔和及强硬等礼貌程度。
1
中日语言与“礼貌原则”的前期研究 仔细梳理前期研究,北京大学的顾曰国先生根据中国的历史文化背景和中国人日常交际的特点,提出
*基金资助:受上海财经大学青年教师预研究项目-基本科研业务费(项目编号:2013110037) 。
- 194 www.erfrontier.org
了汉语言文化交流中四个方面的礼貌特征:即尊重、谦逊、态度热情和文雅[2]。王建华先生认为语言礼貌在 话语层面上是否礼貌,其决定因素是语用距离。语用距离就是指交际双方在特定的交际环境中所感知和确 认的彼此之间的关系密切程度[3]。井出祥子指出 Brown&Levinson 的理论在日语普通话的适用范围上具有局 限性。她同时指出欧美的各种理论都忽略敬语使用中的某些独特性,为了说明这一问题,她提出了一个 “根据情况,选择用语”的原则[4]。泷浦真人解释研究工作者应该如何利用 Brown&Levinson 的礼貌理论去 研究日语,同时指出礼貌原则和敬语、距离、终助词的意思之间的关系[5]。宫地映史从经济学的角度和风险 的观点来探讨日语中的“待遇表现”。他将待遇表现分为“上下”、“内外”、“亲疏”关系,取其中的 最大公约数订出“心理距离感”的标准[6]。福井启子以电视谈话节目中的谈话为材料,分析了人际交际中表 现在语言行为上的中日“心理交际距离”的差异[7]。 前期研究对“礼貌原则”与“中日语言的特点”做了深入的分析,取得了优秀的成果,但是对于“提 醒句”的研究甚少,且研究方法需要进一步的改进。因此,本文尝试使用文本挖掘技术抽出所需关键词和 关键数据,对中日提醒句进行系统的多维度对比研究。
2
中日提醒语句 提醒语句用于对组织团体、周围人群的提醒,通过告诫或从旁指点的方式,使唤起已经忘记的事情、
或者使他们觉察到面临的危险。中文中的提醒语句通常有:“请不要”、“请注意”、“请别”等,通常 以“喂+人称代词+请不要/请注意/请别”的形式出现。 日语的提醒语句通常以“おい+人称代名詞+注意喚起表現(喂+人称代词+提醒的具体内容)”的形 式出现,内容方面有提醒水电浪费、提醒减少噪声污染、提醒注意安全隐患等。提醒对方注意危险,或者 不要做某些事情,这属于日常生活中比较常见的语言行为。由于是要提醒对方的某种行为,表达不得体就 很可能给对方造成困扰。本文着眼于提醒别人注意安全问题时所使用语言的特点以及面对长辈或晚辈时, 所使用语言中礼貌程度的差异。
3
调查场景与调查目的
3.1 调查场景设定 自己家附近的实施工地上有一个大坑。此时,自己的一个熟人老爷爷/师弟、师妹在工地上走着,他 不知道这个工地禁止入内,而且他已经走到危险的大坑边上。周围没有其他人,如果你不马上大声地提醒 他的话,老爷爷/师弟、师妹很有可能会掉到大坑里去,这时,你会用什么语言来提醒他?对老爷爷(长 辈)你会怎么说?对师弟、师妹(晚辈)你会怎么说?
3.2 调查目的 提醒别人注意危险是日常生活中比较常见的语言行为。虽说是善意的提醒,但是如果表达不得体就可 能给对方造成困扰。因此,在实际生活中,根据不同的情况,说话人会选用各种各样不同的表达方式。对 于日语学习者来说,充分了解中日提醒语句的异同、对实现有效的跨文化交际具有重要的意义。本文从礼 貌程度的角度,主要从以下两个方面考察了中日提醒语句中存在的个性与共性。 (1)中日提醒语句中的“礼貌程度”是否存在地域差异? (2)对方为长辈或晚辈时具体使用怎样的措辞? 本文中的有效问卷为日本 705 份、中国 196 份。研究方法引入分词技术以及文本挖掘技术,使用数据处 理软件 EXCEL2013 对调查数据进行信息抽取及变量之间的类别联系的对应分析;并使用 Trend Search 2008 将其转换成简明的可视化信息数据图表,利用简洁明了的图表对中日大学生提醒句中的礼貌程度进行对比 研究。 - 195 www.erfrontier.org
提醒语句的分类
4
当提醒长辈(老爷爷)或者晚辈(师弟师妹)千万别掉进工地的大坑的时候,通常会用哪种类型的提 醒句?根据调查数据的统计结果,本文将提醒句分为 5 类,分别为“陈述句”、“请求句”、“祈使句”、 “疑问句”、“建议句”。各类句型分别包括以下内容。 (1)陈述句:「危ない(危险)」、「穴が空いている(有大坑)」、「穴に落ちるよ(会掉进坑里 哟)」、「工事中で通れない(工地不能过)」、「立入禁止(禁止入内)」、 (2)请求句:「ください、~ないでください(请+V/请不要+V)」 (3)祈使句可分为以下几种类型 「するな(不要+V)」、「戻ってこい/戻って来なさい(快回来)」、「V+だめ(不能)」、「〜 ~てはいけない(不可以)」、「ストップ(停下、止步)」、「気をつけて(注意)」、「出ておいで (快出来)」、 「するな」的动词原形加「な」是禁止某人做某事,态度语气极为强硬;「戻ってこい/戻って来なさ い(快回来)」为动词的命令形,语气比较生硬;「V+だめ」表示禁止对方某种行为,语气较为强硬; 「~てはいけない」表示委婉的命令指示,希望对方停止正在进行的动作;动词的「て」形表示轻微的命 令;「出ておいで」这种动词的「て」形加上「おいで」是一种带有亲密感的不生硬的命令。 (4)疑问句:「何をしている?(你在干什么?)」、「危ないじゃない?(不是很危险吗?)」 (5)建议句:「したほうがいい(最好这样做)」/「しないほうがいい(最好别这样做)」、「しな いほうがいいじゃないかなあ(不这样做不是更好吗?)」 譬如:「出てきたほうがいい/最好出来」、「入らないほうがいい/最好别进出」、「入らないほうが いいじゃないかなあ(不进去不是更好吗?)」
调查结果分析
5
社会交往中,礼貌是促进人际关系的必要因素。因此使用礼貌语言能够保持交际双方的良好社会关 系,使交际在和平友好的气氛中进行。到目前为止,在语言学的研究领域中,以“提醒语句的礼貌程度” 为考察对象的寥寥无几。因此,本文试图从研究“礼貌程度”的角度出发,来探讨中日文中提醒语句的表 达特点。具体研究包括其提醒方式、语言的构成要素、语气的柔和及强硬等礼貌程度。
5.1 中国大学生提醒晚辈 调查结果显示,根据提醒的对象,中国人的提醒语句的使用方式和使用心理是完全不同的。当对象是 个人、且对象为晚辈时,倾向于用“直接提醒”取代“间接提醒”,提醒语句的表达有“危险”、“有大 坑”、“工地不能过”、“小心”、“不要进去”、“赶紧离开”等等。根据礼貌程度可分为以下几种情 况。 (1)只提醒对方有危险。 (2)既提醒有危险,又描述危险的具体状况。 (3)既提醒有危险,又描述危险的具体状况,还提醒回避危险应该采取的行动。 礼貌程度最高的为第三种提醒方式,可以为它定义一种模式: “附加词+理由+直接提醒方式/间接提醒”。 其中“附加词”为对对方的称呼,接着说明提醒的理由是因为“正在施工”,或者前面有“大坑”, 再用直接或间接的提醒方式,即“不要过去”或“请注意危险”等语句提醒对方注意安全。 提醒晚辈使用的关键语句如图 1 所示,可见无论是北方的河南省、黑龙江省、吉林省、辽宁省、河北 省、内蒙古、山东省、天津市,还是南方的上海市、江苏省、湖南省、安徽省、福建省、西部的四川省、 - 196 www.erfrontier.org
贵州省、甘肃省的学生,他们的提醒语句都集中在原点附件,这表明这些地区之间使用的语言没有明显的 差异。譬如说,很多地区的人都用“小心”、“前面有坑”等形式来提醒对方,就得到了图 1 的结果。 根据调查数据的统计结果,可知 5 类提醒句使用的比率分别为:陈述句 23.6%、请求句 15.7%、祈使句 61.5%、疑问句和建议句均未出现。语气较生硬的直接提醒语句的祈使句所占比率很高,而描写危险状况的 “陈述句”和语气柔和、礼貌程度高的“请求句”所占比率较低。说明中国大学生当提醒的对象为晚辈 时,倾向于使用直接禁止,而不是委婉的提醒。所用的提醒表达方式相对比较单调,表达方式也根据对方 的年龄及辈分、亲密程度进行相应的调整。 4.000
请绕道
2.000 吉林 请不要动
河南 不要进去 不能去
第 2 -2. 000 軸
快点出来
甘肃
-1. 000
快回来
会掉进坑里 危险
-0. 500 正在施工
停一下
四川
黑龙江
不要动
辽宁
0.000
-1. 500
请等一下
有坑
贵州 0. 000
天津 快出来
河北 禁止入内 小心
上海
别动
内蒙古 注意前面
不要去 快离开那里 不要往前走
0. 500 安徽
1. 000
不能进去
江苏 湖南
1. 500
那里不能去
福建 好象不能进去 请注意
-2.000
请快点儿离开 请不要去
请小心 请走出来 请停下
-4.000 请不要进去
-6.000
第1 軸 图 1 中国大学生提醒晚辈
5.2 日本大学生提醒晚辈 根据调查数据的统计结果,可知 5 类提醒句使用的比率分别为:陈述句 64.7%、请求句 0.3%、祈使句 27.5%、疑问句 5.3%、建议句 2.4%。描写危险状况、礼貌程度中等的“陈述句”所占比率最高,其次是语 气严厉的“祈使句”和礼貌程度不太高的“疑问句”,语气最为委婉的“建议句”和“请求句”也占了一 定的比率。整体上来看,提醒晚辈时,和中国大学生相比,日本大学生更倾向于使用间接提醒语句,提醒 表达相对比较丰富,这和日本的暧昧文化以及日语本身的特征有着密不可分的关系。 调查数据显示,中国大学生所有人的问卷都用普通话作答。而面向日本大学生的统计数据结果表明, 无论是东北、关东、中部、北陆地区,还是近几、中国、四国、九州地区,提醒模式没有地域性的差异, 但是有超过 70%的人使用方言,尤其关西地区的大学生比关东地区更有喜欢使用方言的倾向。即便是方 言,和普通话也比较接近,所以日本政府并不积极推广普通话,年轻人也不忌讳使用方言。但是因为中国 的各地方言不易理解,难以沟通,所以中国政府大力推广普通话,便于消除方言隔阂,促进社会交往。 表 1 日本大学生提醒晚辈
晚辈
陈述句
请求句
祈使句
疑问句
建议句
64.7%
0.3%
27.5%
5.3%
2.4%
- 197 www.erfrontier.org
5.3 中国大学生提醒长辈 提醒长辈使用的关键语句如图 2 所示,可见无论是哪个地区的学生,他们的提醒语句“小心”“危险” 等都集中在原点附近,这表明这些地区之间使用的语言没有明显的差异。 根据调查数据的统计结果,可知 5 类提醒句使用的比率分别为:陈述句 47.4%、请求句 44.5%、祈使句 3.6%,建议句 2.04%,没有出现礼貌程度不高的“疑问句”,但是出现了极为恭敬有礼的“礼貌句”,具体 内容为“大爷,那边不能过去,正在施工,您过去有危险,您要去哪?我带您过去。”、“老爷爷,您走 进了施工现场,别担心,您跟我走,就能走出来。”等等。此类“礼貌句”占了 2.5%的比率。 和提醒晚辈时相比,提醒长辈时使用的“请求句”和“礼貌句”比率骤然上升,且表达模式多为礼貌 周到的“附加词+理由+间接提醒”模式。礼貌原则贯穿着一个中心内容,那就是尽量使他人得益和尽量 使自己吃亏,话语说得越间接、婉转就越客气,可以更好地营造出更礼貌、融洽的交际氛围。中国人最讲 究 “长幼尊卑”,此次的调查结果说明中国大学生较好地传承了先辈流传下来的敬老、爱老、助老的传统 美德。 4.000
快离开那里
2.000 吉林
您进入工地了
黑龙江
河南 不能进去
第 2 軸 -2. 000
请绕道
小心 请等一下危险
-1. 000
-0. 500 请不要去
请来这边
不能去
河北
甘肃
0.000
-1. 500
天津
注意脚下 辽宁 不要往前走
四川
请小心
请注意
贵州 0. 000 请快点儿离开
不要去
内蒙古 不能进去 请不要进去
有坑
0. 500 安徽 1. 000 上海 请停下 那里不能去 请回来 江苏 福建
湖南
正在施工 请快点出来
1. 500
请走出来
最好别进去
-2.000 最好早点出来
会掉进坑里 请来这边
-4.000
第1軸 图 2 中国大学生提醒长辈
5.4 日本大学生提醒长辈 根据调查数据的统计结果,可知 5 类提醒句使用的比率分别为:陈述句 74.9%、请求句 11.2%、祈使句 1.6%、疑问句 0.4%、建议句 10.5%。从使用的语言来看,对长辈使用方言的人数骤减,大家更倾向于使用 郑重严肃的普通话。从语体来看,同样为陈述句时,使用简体「穴があいている」的骤减,而使用敬体 「穴があいています」的人达到了 80%。无论是关西,还是关东地区,在敬体的使用比率方面不见明显的 地域差异。 提醒长辈时,与中国大学生相比,日本大学生更倾向于使用具体描述危险状况、礼貌程度中等的“陈 述句”。其次才是“请求句”。而中国大学生的“请求句”在 5 类提醒句中所占比率明显高于日本大学生。 与提醒晚辈相比,提醒长辈时所用的表达方式类型丰富,这一点无论是日本大学生还是中国大学生都是一 样的。 表 2 日本大学生提醒长辈
晚辈
陈述句
请求句
祈使句
疑问句
建议句
74.9%
11.2%
1.6%
0.4%
10.5%
- 198 www.erfrontier.org
6
结束语 “礼貌”在某种程度上是一种能让人较好地立足于社会的如空气般必不可少的生活元素,为所有人在
社交活动时发挥重要的作用,为此,我们有必要对日常生活中经常用到的提醒语句中的“礼貌程度”的实 用性进行探讨。在不同的文化背景下,语言也具有其独特性,提醒的对象不同,使用礼貌程度不同的语言 也在意料之中。本文使用文本挖掘的研究方法,在统计语言数据的基础之上,挖掘中日提醒语句中所隐藏 的语言特征与现象,探索了其中的个性与共性。
致谢 本文的研究得到了日本德岛大学综合科学部岸江信介教授的悉心指导,特致谢意。 本文为青年教师预研究项目-基本科研业务费(项目编号:2013110037)《基于文本挖掘技术的中日 礼貌措辞研究》的阶段性成果之一。
REFERENCES [1]
Matsumura Naohiro, Forhumanities: text mining of social science, seishinshobo,2009
[2]
Guyueguo, Politeness Pragmatics and cultural: Foreign Language Teaching and Research, Vol.4, pp.9-11, 1992
[3]
Wang jianhua, Utterance Politeness and Pragmatic Distance: Journal of Foreign Languages, Vol.5, pp.25-31, 2001
[4]
Ide satiko, discretion Pragmatic[M]: Daisyuukan Bookstore, 2006
[5]
Takiuramasato, Politeness principle introduction [M]: Nihonkenkyuusya, 2008
[6]
EishiMiyaji, A Study on the Linguistic Performances and the Occasions of Background Related with the Evaluation of Polite Expressions from the Angle of Economics: An Approach Based on the Viewpoint of Risk: Yishou University Master Dissertations, 2009
[7] Hukuikeiko, A Research on the Relationship Between the Psychological Distance of Communication and the Different Speech Act of China-Japan: Jilin University Doctoral Dissertations, 2010
【作者简介】 米丽英(1978- ),女,汉族,博士,副教授,研究方向:文本挖掘技术与应用语言学。 Email: mily6903216@gmail.com
- 199 www.erfrontier.org