「英文摘要」Human\'s thoughts and behaviors can be understood by researchinto words and phrases that constitute the material.Compared with theaverage using frequency ,a key word can be found if it appears frequentlyin a given time.In calculating ,it should be noticed that it is necessaryto analyze the statistics averagely.Change of words of high-frequencyreflects the change of polices,and usage of compound words can reflectmore specific changes.
「关键词」人文社会科学研究/高频字词/计量分析法humane and socialstudy/words with high-frequency/calculating analysis method
①这里介绍笔者为此研究而使用的软件:中共党代会政治报告的电子数据是从人民日报社的人民网http://www.people.com.cn上“资料中心”的文本资料“中国共产党历次全国代表大会”那里下载的。在处理时运用了可以处理中文和日文的EmEditor这一软件。EmEditor这一软件除了日语版和英文版之外,还有简体中文版和繁体中文版。在中文的os上类似于这样的处理文本的软件几乎没有的情况下,实在是一个非常方便的软件。汉字和词语的频度统计计算,运用了横滨国立大学工学部研究科研究生特别编制的程序charactor counter 、word counter,但由于其本身很简单,故前者用于计算全角文字的数值,后者计算用户做成的符合文本文件的文字的数值。此外还使用了KWIC Finder 这一检索软件。由于此软件可以以KWIC(keyword in context)形式表示检索结果,很方便于进行分析。但是毕竟是日语检索的软件,为了检索中文文献就必须转换为Shift JIS 以检索中文数据。也就是说,中文作者必须在Shift JIS 的基础上使用能够键入中文的软件。然后在整理和分析检索结果的时候使用了Microsoft 的Excel.过去从未想到的一例有趣的研究是,横滨国立大学教育学系的学生总汇了1946年到1995年的《人民日报》新闻中包含“地震”一词的新闻。从印刷物中寻找包含“地震”的新闻即使花一年、一个月都是很艰难的事情。但是现今《人民日报》的新闻已经被电子数据化,制作成光盘予以发售。由此,本科生的毕业论文也能够进行这样的研究。作为同样的事例,笔者能够介绍国会会议录检索系统http://kokkai.ndl.go.jp/(这里可以在线检索从1947年6月3日到现在为止的国会的所有会议录)。笔者运用国会会议录检索系统检索了包含“尖阁列岛”或“尖阁诸岛”或“鱼钓岛”的议事录,这些词语最早在1954年2月15日参议院水产委员会出现,出现次数以1978年最多,其次在1971年、1997年也多次出现。即使足不出户,在很短的时间也可以查阅到这些资料。