« 横浜 | トップページ | 額縁 »

lexical diversity

41cpw8giqyl_sl500_aa240_ 学生のライティング・サンプルの分析を始めたのだが,rating scale (評価尺度)に問題があるような気がして,もう一度本を読み直す.

 Shaw & Weir (2007)の"Examining writing: Research and practice in assessing second language writing"は,ライティング評価について,ケンブリッジESOLとIELTSの妥当性検証の報告をしており,大変興味深く,またとてもためになった.

 勉強不足で恥ずかしいのだけれど,この本を読んで,"lexical diversity(語彙的多様性)"を測定する"D"という指標が,Duran et al (2004)によって発表されたことを知った. type/token measureの問題点を解決する新しい枠組みとして注目されているらしい. 本当に使えるのかどうかについてはもっと先行研究を読まなくてはいけないけれど.

この語彙的多様性の指標である"D"は,CHILDES, CLANの中にある"vocd"というプログラムを走らせて計算するのだそうだ. CLANと聞いて,ハワイ大学でコーパスを教えてくれたべんじゃみんを思い出してしまった. いきなりPythonを書けとか言って散々な目に合い,成績はA-をくらってしまった. わたしの博士課程でのGPAが4.0にならなかったのはべんじゃみんのせいなのである. べんじゃみんめ. というかプログラムが書けなかった自分が悪いのだが. ところで,べんじゃみんは正確にはBenjaminと表記する. 名前にも性格の悪さが出ているような気がする. べんじゃみんめ.

そんなことを思い出しつつ,CLANを開けてプログラムを走らせてみた. 一度べんじゃみんのクラスでさわっているので,使い方も何となく分かる. べんじゃみんに感謝しなくてはいけない. でも,肝心の自分の研究用データが開かず苦戦する. 解説を読むと,CLANではファイルはすべてCHAT formatにしなくてはならないとのこと. そういえば,ファイルの拡張子は,すべて「.cha」になっている. ちゃー 

「txt.」から「.cha」への拡張子変換というのは可能なのでしょうか.

D」に「ちゃー」に何かいろいろ勉強不足を痛感する. 

これまではディスコースやレトリックばかりに目を向けてきたが,ライティング研究をする以上,レキシカル・レベルの発達にも目を向けなくてはいけないと思いつつある. これからは語彙に関する文献もちゃんと読んでいこうと思う. 

気が変になるほど勉強してやっとA.B.D.になっても,まだまだ知らないことはたくさんあると痛感する. 

|

« 横浜 | トップページ | 額縁 »

コメント

.chaもテキスト形式なので、プログラムを書けば、.txtから変換できそうですが、.txtのなかみが.chaに対応しているかどうかが問題になりそうです。

投稿: しらいし | 2009年8月21日 (金) 06:34

しらいしさん,ありがとうございます.

ファイルの【名前の変更】だけではtxt.→cha.への変換はできないのですよね….強引に変換してvocdを走らせてみたのですが,

vocd terminating. Bye!
と言われてしまいました.

自分でプログラムが書ければtxtファイルを解析することもできるのでしょうか.また相談にのっていただければありがたいです.

投稿: satchy | 2009年8月21日 (金) 14:55

ファイルの名前の変換だけだとだめだと思います。txtファイルを読み込んで、解析して、chaファイルを書き出す、みたいなプログラムが必要ですね。

投稿: しらいし | 2009年8月21日 (金) 19:15

しらいしさん,ありがとうございます.

ちょっと助けてもらってもよいでしょうか.授業料は高くなるでしょうか.

投稿: satchy | 2009年8月23日 (日) 14:52

コメントを書く



(ウェブ上には掲載しません)




« 横浜 | トップページ | 額縁 »