見出し画像

文化祭で心理テストという名のアンケートをやってみた!

社会実験をしてみたい!!!

と、思ったことはないですか。

 人間観察が趣味な人っていますよね。そのような人の生態はどうなっているのでしょうか?
 「趣味は人間観察です」というと、「ストーカー?」みたいに思われる方もいますが、そうすれば「趣味は人間観察」=「(趣味は)ストーカー」というわけのわからない等式が出来上がってしまいます。これにはアインシュタインもびっくりです。

 ところで、「趣味は何ですか?」と聞かれたら私は「人間観察」と答えるでしょう。一歩広げて「社会観察」と答えるかもしれません。子供の時百科事典を読むのが好きだった私は、社会に対する興味が当然のように沸いておりました。同時にいたずら好きでもあったので、誰かにちょっと意地悪してどうなるのか反応をうかがってみたり、、、今思えばかなり陽気な子でした。(笑)みなさんが授業中にテロリストの妄想をするのと同じように、私はいろいろな社会実験を想像しておりました。

 私は好奇心から現実社会を一目みてみようと思い、高校生という段階で大勢の人々にアンケートを実施してみました。質問内容は自分の思いついたことから科学的根拠のあるものまでと多岐にわたります。結果も後で述べるとおり、面白いものが多く、非常にやりがいのあるアンケートとなりました。ぜひとも見ていただけると幸いです。

 この記事の作成にあたり、ご協力してくださった方々に深く感謝を申し上げます。
 ※この記事は長文ですが、まだまだ作成途中です。随時更新していきます!


0 本記事の構成

 この記事の構成は大変複雑となっております。
 当初は出来事順でこの記事を書こうとしていましたが、文字数が4万字を超えて、読解力がいくらあっても読めないような大変な文章になってしまったため、大幅に改造して各種類・ジャンル別で書き替えました。

 目次は上の方にあるのでそちらを見ればいいですが、そのまま飛んでしまうと多分わけのわからない用語に悩まされることになります。これを防ぐため、本記事では難しい単語の説明はストーリー部分に任せ、主題となる結果部分はなるべく簡潔になるように書きました。順番通りに読めば、なるべく理解できるような構成にはしてありますが、どうしてもわからないことがあれば調べたりしてくれると助かります。

 本記事の前半部分は試行錯誤に満ち溢れたストーリーで構成され、後半部分は各回の研究を一つにまとめるように構成されております。ぜひ見てください!

ストーリー部分

1 実行までの道のり

 木の下でリンゴが落ちるのを待っている。
 中学二年の時、心理学に興味を持ち、メンタリストDaigoのような心理学&行動学を扱うチャンネルの動画をよく見ていました。当時はただのマイブームの一つでしたが、いつのまにかその気持ちが膨らみ「人の心を自分で捉えてみたい」と思うようになりました。
 
 「あの人がどのような性格を持っているのだろうか。」

 その後高一になり、私が入っていたとある部活から「個人研究を進めてほしい」という指令が来ました。当時の私は天体観測が一つのマイブームでしたので、望遠鏡とか使ってみたいな~と思っていました。しかし、望遠鏡を使った研究で何をやっても、アマチュアの天体観測者には敵わないと思いました。天体観測はゴルフ並みに活性化エネルギーが高い仕事だったので、このままであれば間違いなく来年には学費が払えなくて学校をやめてしまっています。

(私は誰かと重なることが嫌いでした。オリジナリティを持ちたいような人でした。もちろん、友達などと趣味が重なればうれしいですが、自分にできる特技が友達にもできるとわかったら悔しい気持ちになってしまいます。現在YouTube投稿をしているのでそちらの動画を見ればわかりますが、他の人と違う方向に舵を切っているというのが一目瞭然でしょう。)

 誰も見つけてないような、知らないものを探ってみたい。そういう好奇心が何を引き立てたのか、私をこのように誘導しました。

 「いっそのこと、アンケートをとってみたら?」

 ケンタッキーが赤字から回復した理由をご存じでしょうか。昔、ケンタッキーは比較的値段の高いものを中心に販売していました。当時初めてケンタッキーを訪れた8歳の私ですら、高いな!?と思ってしまうほどでした。
そこで、当時の最高マーケティング責任者(CMO)であった中嶋氏は、顧客からの情報を基に、ケンタッキーのテコ入れをしていくことになりました。

中嶋氏が戦略の軸に据えたのが、期間限定商品と割安なセットメニューの「二層戦略」。それまでの商品施策は、季節に応じた期間限定商品に偏っていた。安売りに頼ることをしなかったのは、「商品の価値を下げたくない」との自負からだった。

価格面での訴求を控えてきた結果、顧客には「ケンタッキー=高い」というイメージができあがっていた。調査を行っても、「ケンタッキーはおいしいけど高い」、「特別なときに食べるもの」という声が上がった。中嶋氏は、ここに切り込んでいく。

客数20%増!「ケンタッキー」超復活の仕掛け人(東洋経済オンライン)
2019年7月12日の記事 (2024年5月4日に再閲覧)

 これにより、ケンタッキーによく行けるようになりました。だって、500円でランチが食べられるから。
 それはさておき、「高いと言ってくれたお客さんナイス!」と思いながら私はこう考えました。
 「聞き込みの力ってすごくね!?」
 実際に私もマーケティング戦略に乗ってやってきているわけですので、ケンタッキーが聞き込みを通じてマーケティングを成功させたと言っても過言ではないでしょう。この流れから聞き込みという部分を抜いてしまえば、元も子もないでしょう。

~アンケート一つで、会社を赤字から回復させられる力がある。ならば私もやってみようではないか!~

 なんて輝かしい高校生なんだ。しかし、当時の私は好奇心に負けてはいられない。すぐにアンケート作りを開始させることにしたのです。
 だがここで問題が発生。勘の良い方ならなんとなくお察しだと思いますが、まだ気付いてない方はここらへんでストップして考えてみてください。

 「アンケートって、どこでやるん!?!?」

 はい、すごい根本的な問題ですね。
 あなたがこのような状況に遭遇した時、どうしますか?タイトルを見ればわかるようなことですが、一旦その情報を頭の中から完全にフォーマットした状態で考えてみてください。繰り返しますが、私はオリジナリティが自分の個性なので、(←若干小泉構文)普通の人が思いつくことはしません。

 「文化祭でアンケート取ればいいんじゃね!?!?」

 はい、タイトル回収。(?)
 正直言って、これ思いついた私天才じゃね!?と思ってしまいました。文化祭というお祭りであれば、集客に苦労することはありません。本来私の学校の文化祭は来場者数が多い方ですので、人を集めようと思えばいくらでも集められます。
 つい最近慶応の三田祭を見に行きました。建物の中に行動学を含めた経済学の研究レポートがいろいろ貼ってありました。そのレポートの内容によると、Instagram等のSNSに流して友人に拡散を手伝ってもらっただそうですが、こちらは違います。文化祭ですよ。集客も0代から60代までと多岐にわたります。集められる人数もSNSだと最大で60,70人なのに対し、こちらでは最大で400,500人の集客が見込めるのです。
 だが、こんなのはあくまでも理論値にしかすぎません。あなたが文化祭で数分程度のアンケートを意味もなく急に求められたとき、喜んで受けますか?否、絶対受けないでしょう。ならば当時の私はどうしたか。

 「心理テストということにして、その結果を報酬とすればいいんじゃね!?!?」

 意味わからんことを言い出したなと思った方。安心してください。私もそう思います。
 通常のアンケート調査では、「これに回答すれば無料ドリンク1杯分!」といった感じで金銭的報酬を与えたもとでやることが多いですが、私にそんな予算があるわけないです。限られた3000円の予算内でどうにかやりくりしないといけなかったため、300人に調査するとなると1人10円分の報酬と、うまい棒レベル(というか12円で買えない)になってしまいます。しかもそうすると、予算0ですべてをこなさなければならなくなるので残りすべて自腹になってしまいます。テスト記入用の鉛筆、消しゴム代等すべてに加えて、結果返却用の赤ペンや、結果収納用のホチキスや針、立ってもアンケートを受けられるようにできるためのクリップボード等(しかも高い)がもろもろ必要になってきますから、明らかに予算オーバーです。そもそも3000円の予算だけだと百均27回分にしかならないので、明らかに予算不足なのがおわかりだと思います。
 つまり、最適解は「心理テスト」しかなかったのです。
 
今の日本で予算が足りないと嘆いている学者さんもいますが、その気持ちがよく理解できるような体験でした。

重い決断

 早速「文化祭で心理テストと称した研究用のアンケート」を実施するため、いろいろと準備する必要がありました。
 まずは人員。こちらはお友達でまかなえたいところでした。しかし現実はそう甘くいきません。人を案内するのに人員がいります。結果用紙を書きながらでも人は絶えずやってきます。客からの質問も舞い込んできます。
 勧誘等の人材も必要でした。部活の中でのちっぽけな1コーナーとしての実施でしたので、文化祭で配られるパンフレットとかにも掲載されていません。下手したら数十人しか集まらない、という危機感をもって当日に挑むという予定でした。なぜ"予定"なのかというと、ここで問題が起きてしまったからです。

 ~テスト準備から結果分析まで、すべて自分がやらなければいけない。~
 
 友達がいないからではありません。部活内の友達はみんな手伝う余裕などなかったからです。私のいた部活の文化祭はとにかくブラックで、準備から後片付けまですべて徹夜であるかのような状態でした。中学生であったとしても文化祭の前日の20時まで学校で部誌を作らされます。(※中高一貫校)このような状態で、私を手伝える友人などいたのでしょうか?(いたらむしろ恐ろしいくらいです)
 当日のシフトもほぼ全て駆り出されてしまいました。部員の中には一日全シフトに入れられている人も珍しくなく、軽いほうであったとしても5~6時間程度でした。そこにクラスのシフトも入りました。文化祭が2日でおよそ12時間ですから、青春を実質半分奪われているようなものでした。(幸いにも共学の学校でしたが)このような状態で、私を当日手伝える友人などいたのでしょうか?(いたら教えてほしいくらいです)
 他の部活の子を呼べばいいじゃない!と思うかもしれませんが、どこかも知らない謎の部活の手伝いをしてほしいと依頼するのは完全に不審者です。「ねえ、お姉さん。いまから遊びに行かない?」と頼んでいるようなもんです。イケメンであってやっと許せるくらいでしょう。実際に依頼はしてみましたものの、アンケートの内容が高度すぎて全く理解されませんでした。(内容は後述)

 文化祭の当日の朝まで、過労でなんの理由もなく泣きながら、心理テストに必要な資材の購入、心理テストの質問紙、結果用紙の作成、及びそれの倫理審査(実施内容的に、スクールカウンセラーとの相談が一番ベストと考えました)、来場者への景品(心理学の知識をまとめたパンフレット)を作ったり、ということをしてきました。クラスの企画の手伝いをしつつ、部活のどこのスペースを割譲するかの相談をしながら、部活のメイン企画の講習も受けなければなりませんでしたし、勧誘用のポスターを作成する必要もありました。これらの業務を2週間程度で済ませなければならなかったと思うとかなり地獄だったように感じられます。まず精神を保つことすら無理でした。なんの理由もなく泣いてしまった時には、「ああ、自分もう無理なんだな。」と思ってしまいました。

実際に作成した資料たち

刹那の二日

 そんなこんなで文化祭を迎えましたが、用紙の印刷が間に合わなくてとにかくドタバタしていました。だが、顧問の先生のスムーズな誘導によって、応急処置をしながらギリギリ間に合わせることができました。
 心理テストという名のアンケートをやっていることを示すために、教室の前の壁に飾る看板を人のいない時間帯で作っていきました。、、、という感じで最善を尽くした初回のテストですが、やはり想像以上の人員が集まってきたので事前に万が一のために準備しておいたクリップボードを使う羽目になりました。最終的には裏方においてあった机を強制的に引っ張ってきたりしました。
 人員のほうですが、部活から解放された友達が積極的に手伝いに来てくれました。特に部活外の友達が手伝いに来てくれたのがとてもうれしかったです。しかもテスト自体がかなり高度な内容でしたが、それを一瞬で理解してくれたりと、(私が滅多に使わない言葉ですが→)めちゃくちゃ頭よくね!?と思っていたりしていました。その人に対してはまじで感謝でしかないです。
 が、それ以外は基本的にワンオペで回してました。今思えばかなりイカれたことをしていましたが、テストの専門性や人員不足の観点からこうせざるをえませんでした。むしろ、むやみに頼めなかったという言い方のほうが正しいのかもしれません。
 という感じで過ごしてきたわけですが、はたしてどのようになったのでしょうか。実体験はもちろん、後述の結果部分では図や表を交えながら書いていこうと思います。

2 訪れた転機

 高1の夏、文化祭の過労で泣いていた私にとある消息が届きます。"ホワイト"な社会科研究部の勧誘が届いたのです。

 「これはチャンスに違いない!」

 と思い、ゴールドラッシュで金を探す若者かのように、私はかすかなドリームを持って同じ部活の友達と一緒に社会科研究部に飛び込んでいきました。しかし、時代が時代で、当時の社会科研究部は戦場の跡地かのように朽ち果てていました。社会科研究部は途中入隊してきた私たち3人にとって、希望と絶望が折り重なった場所であるかのように感じられました。

 「それなら、部活を作った方がましじゃね?」

 と思って学年主任の先生に話を持ち掛けてみましたが、予算等の都合もあって結局は断念する羽目になりました。このようにして、私の社会科研究部ライフが始まったのです。
 顧問の先生は早稲田卒で、世界史&政治経済を専攻していました。授業を受けたことはないのですが、世界史に関してはまじのマニアだそうです。しかも、サブの政治経済にも結構詳しい方だそうで、経済に関する研究をしたこともあるようです。(なんなら株で結構稼いでいるといううわさもあるくらいです。(※合法))
 私が入った当時、部員は合計で12名程度しかいませんでしたが、懸命な努力により今となっては約3倍の35名が在籍しております。ここら辺に関して具体的に話してしまうと字数が大変なことになってしまうのでまた今度の機会にします。

 グーグルスプレッドシート(エクセルのようなもの)を使った結果の統計作業は非常に大変でした。当時の私は授業で教わったスプレッドシートを使っていたので、何が何なのかを調べる作業は非常に信じがたいほど時間がかかりました。スプレッドシートは直感で使えるものが多いですし、周りに統計ソフトを扱えるような友人や先生がいなかったため、他の選択肢がなかったのも当然でしょう。
 あと、一回目の文化祭でサイズが100個以上のサンプルがおよそ200セットもあったので、一つ一つの回答を手入力していくのがかなり時間のかかるものでした。一つの回答を入力してTABキーで他に移り、また回答を入力するといった地獄の単純作業がトラウマになってしまうほどでした。一つの回答の入力に早い人だと3分、遅い人だと10分かかるので、全部の項目を入力すると10~30時間かかるような作業でした。プライバシーの関係上、教室ではあまりやらないでほしいとのことだったため、当時は限られた時間で広い部室に友達を呼んでやっと終わらせた記憶があります。

 そして、なんとなく分析を終わらせた高2の春。社会科研究部でやる企画を考えていたところ、何を思ったのか「よし、心理テストをやろう!」となってしまいました。
 正直言って先ほどのデータだけでも良かったのですが、さすがに自分の好奇心には逆らえませんでした。当時は金を探し求めた4人と新入りの高1部員8人程度しか活動していなかったため、すぐに企画のGOサインが出てしまいました。

 「しょうがない、やるしかない!」

 ところで、前回の心理テストでは自由記述欄を設けており、とにかくテストが長いといったような意見が多かったです。(100問以上もあったので当たり前)
 さすがに文化祭で十数分もかかるテストをやらせるのもあれなので、何かできることがないかなと模索していた結果、このような結論に至りました。

 「心理テストそのものの内容を減らそう!

 おばあちゃんを助けたために遅れたからおばあちゃんを助けない、という小学生の考えるようなことを述べていますが、これは私にとって大きな改革でした。よく見てください。心理テスト"そのもの"ですよ。
 1回目は心理テストとして約50問のエゴグラムを採用しましたが、今回は質問数を減らしてみようという試みです。

 市販のエゴグラム、またはネット上に出回っているエゴグラムは大抵50問程度になっていますが、本来50問でなければならないという理由はないようです。ということは、BIG5の短縮版であるTIPIがあるように、エゴグラムの短縮版が存在してもいいではないか、という考えのもと作らせていただきました。
(そもそも文化祭で返す結果が"ガチ"のものだといろんな意味でやばいので…)

 このテストを以後、短縮版エゴグラムと呼ぶことにします。短縮版エゴグラムについては基本的にTIPIと一緒で、各項目(エゴグラムにおいてだとFP, MP, A, FC, ACの5つ)に関する質問を2個ずつ配置しました。
 また、回答に偏りがなるべく生まれないように、校内向けの事前アンケートを実施いたしました。なお、あくまでも次のジョーク(心理テスト)の作成を目標にしたものであるので、紹介は軽めにしようと思っています。その後、結果に様々な処理を施し、文化祭に進みました。その文化祭での心理テストは第三次の調査と呼ぶことにします。

3 心理テストというアンケート調査、やってみた!

 みなさん、お待たせしました。タイトル(?)回収です。
心理テスト一回目(以降(i)と呼ぶ)では、ほとんど私ワンオペもしくは友達を巻き込んでツーオペみたいな状況でしたが、今回は社会科研究部という心強い仲間が付いていますので、マルチオペ(?)でやっていきます。
 心理テストに関して様々な課題がありました。(i)のように問題数が100問以上存在したり、陽気な人が多く来たり、机と机との隔離が簡易的なものだったり、紙ベースだと後のデータ入力がすごく大変だったりと、多くの問題がありました。これらを95%解決した(のと同時に新たに50%の課題が出現した)のが、この第三次(iii)のテストなのです。
 この(iii)テストについて、昨年の11月からずっと構想を固めておりました。あれはあーやって効率化できないかとか、これはこーやったほうがスムーズじゃないのかなど、いろいろ考えてきました。その証拠として、第二次(ii)みたいな事前調査が生まれたのです。ここからは、(iii)テストまでの経緯について話していこうと思います。また、第四次(iv)テストへ繋がる話も入ってたり….

隠し味

 文化祭は、場所選びも肝心です。普通のモニター調査であれば、「スマホでやってポイント獲得!」なのでどこでもできます。しかし、文化祭で適当にテストのQRコードを壁に貼ってスマホでポチポチやらせてしまうと、倫理上の点だけでなく、歩行者事故も起きて大変なことが起きてしまうので、しっかりと場所を選んでいかなければなりません。
 今回の文化祭(iii)も予約制ではあるものの、前回(i)と違って一般向けの予約枠も新たに用意してあります。

 「調査数が増えるじゃないですか!!!」

 これは特大朗報でしょう。調査数は多ければ多いほどいいです。しかも一般枠なので、幅広い年代を巻き込めます。これほど嬉しいことはないでしょう。
 そうすれば場所も広い所が欲しくなってきます。大きなゼミ室はどうでしょうか?いや、そこに目をつけている人はほかにもいるはず。ならばやめといたほうが得策だろう。
 株で他の人と同じように投資しているだけでは儲からないのと同じく、学校の教室も他の人と被ってしまえば後々は大変なことになります。
 YouTubeでも差別化が重要になってきます。私が運営しているYouTubeでは、なるべくオリジナリティを出して他の人と差別化を図っています。今の時代、だれもメントスコーラをやろうとしません。((((一部除く))))
 そうやって思考をいろいろ巡らせた結果、いい場所が思いつきました。過去から培ってきたオリジナリティをまた発揮してしまったのです。みなさんもどこなのか考えてみてくださいね。

 「自習室だ!!!」

 1年に1回の文化祭で自習室で勉強しようとする者はいません。高3生は別校舎で勉強できる環境はあるものの、他の学年の人の中で勉強しようとするのは相当ドMでしょう。作業好きの人はせめて文化祭のシフト全部埋めといてくれたほうがありがたいです。(というか高3生以外でそこまでしないと受からない人は多分志望校を間違えてます、、、)

 私の学校は、図書館が別の校舎として建てられています。(図書館と教室が完全に分離している学校って珍しくないですか)図書館が1階だけだと寂しいからなのかはわかりませんが、2階にわざわざ自習室までつけられています。しかも、図書館は普通大きいです。小さくないわけがありません。まあ、何が言いたいのかもうお分かりですよね?

 「大きい自習室や!!!」

 語彙力が終わってますが、まあ要するにそういうことです。ラクダの上のこぶがラクダの本体と同じくらい大きい感覚です。(伝われ)相当でかいということがよくわかりますね。それに加えて、自習室だからかそれぞれの机を隔てるような壁がついております。これは心理テストのスペースとして最もふさわしいじゃないですか!(確認してみたら250席以上はありました…いや多すぎ…)

 そうと決まったらあとは実行するのみです。紙からデータに変換するのがめんどくさいなら全部デジタル化しようということで、来場者にはGoogleフォームを通じて答えさせるようにしました。
 また、結果返却時に誰が誰なのかを特定するために、来場者全員にフォームのQRコードが貼ってある番号札を配ることにしました。
 この番号札、最初は番号全て手入力でやっていこうかなと思いましたが、さすがにやめておきました。来場者数が多くても600くらいと予想していましたので、これを手入力でやるのは本当に時間の無駄だと思いましたw
 そして思いつきました。

 スプレッドシートでやろう!

 そう、スプレッドシートでやれば一括ですべての数字をはじき出せるのです。これは本当に便利でした。内容さえ打ち込めば1番から1000番まで全部一括で出せてしまうからです。

実際の番号札(赤い部分は加工されたもの)

 ということで、"まだ何もやってないのにデータ入力というトラウマの再発"を防ぐことができました。入試行こうとしたら受験票忘れた並みにやばいやつですね。(伝われ)なにがともあれ、これで安心してスタートが切れます。

 あとは結果を自動計算できるシステムも作ってしまおう!ということで持ち前のエクセル知識をフル活用して作ってしまいました。
 テスト内容がエゴグラムだけだと、昨年来た人に申し訳ない気がしたので、実は今回のテストでは右脳左脳診断も入れています。回答の偏りを分析するための事前調査(ii)でそのような項目も入れておきましたが、どれをとっても50:50くらいで大差がなかったので、(しかもこの数字は年代で大きく変わると推測されるので)特に触れませんでした。
 そんなこんなで結果の自動計算もできましたら、後は微(?)調整となります。

 まずは回答の偏りを減らしたいということで、来場者全員に景品を配っていこうということになりました。総額2万円。
 予算は3万くらいあるので、他のところをケチればいうて楽勝です。あとは図書館に備え付けられているPCを借りれば準備万端でしょう。

 、、、ちょっと工夫しようか。
 景品配るだけでは面白くない。ならば全員が景品をもらえると保証した上で、さらなる上の特等賞の景品を抽選制にするのはどうでしょう。
 と、いうわけで農協から野菜数十個とスイカを一つ買ってきました。みそきんもなぜか何個かゲットしました。あとは抽選のシステムを整えるだけでしょうか。
 ルーレットもいいなと考えましたが、普通に辞めました。ルーレットにすると、当たり確率の低さがバレバレです。アタック25で枠を1つだけ空けて最終問題に挑むみたいなもんでしょう。
 ということで、1~9999までを乱数で出して、下○桁が○○だったら二等賞みたいな感じで進めました。うまいこと確率の低さをごまかせるのに成功しました。(なんかすみません)

 あとは部員全員分のシフトを作成すれば完成です!(実質パズル)
 と軽々しく言っている割には結構大変でした。昨年から来ている人向けにいろいろ心理学や社会学の知識をまとめた冊子を部員全員で作っていたら結構時間がかかってしまったのです…(合計で2万文字くらい書き上げました)
 当日は命に嫌われているを聞いてなんとかやり過ごした覚えがあります…

 ちなみに景品をもう少し有効活用しようと思って、事前調査(ii)に「事前調に参加した方は、本番での景品当選確率が2倍になります!」と書いておきました。たぶんあれがなければそこまで回答数が多くなることはなかったでしょう。

 場所も最高、お礼も最高。結果の入力や出力も簡単。準備万端と決まったらあとは思うがままに走るだけ。軽自動車に軽油を入れてなければの話だが。

鬼ごっこ

 当日の朝9時になり、なんとか開始まで間に合わせるように頑張りました。100枚×10つ=1000セットの番号札のカット作業をなんとか応急処置で間に合わせました。
 しかし、部活の人員はクラスのほうにも駆り出され、ごく少人数で準備しなければならなかったのが問題でした。文化祭前日からずっとそのような状況だったので、全体としてはあまりにも準備が間に合いませんでした。むしろぎりぎり間に合ったことに関しては奇跡としか言いようがないくらいです。
 しかし、見出しにもあるようにこれはあくまでもいたちごっこにしかすぎませんでした。問題が出ては対処し、さらにそこから問題が出てはまた対処し、という地獄のようなスパイラルが襲うこととなります。

 まず問題が起きたのはスプレッドシートです。スプレッドシートは関数さえ打ち込んで自動で結果が表示されるように整えていました。しかし、やっていくうちにバグが起きることに気が付きました。
 なんと、関数が途切れてしまったのです。
 どういうことかというと、関数をぎっしり上から下まで詰め込んだのが、なぜか途中で途切れ途切れになっているのです。グーグルフォームから送られる回答は一行に収まっており、これが何層にも積み重なっております。それぞれの行にそれぞれの関数を設け、それぞれの関数で結果を計算できるようにしておりました。つまり、そのような関数が離れ離れになってしまったというのはあまりにも深刻なバグだと言えるのです。

 原因を追究する?いや、そんな余裕はない。もうここまで来たからには何かしら手を打たないと…
 そう思った私はある決断に出ます。

 ならばいっそのこと、戦ってみようじゃないか!

 中二病のような発言ですが、これ以外の選択肢は頭に出てきませんでした。まずは関数がいつどのように離れ離れになるのかすらわかりませんでしたので、一つ一つ関数を手確認する作業で応急処置を済ませました。関数がずれているのであれば、修正。といった作業をひたすら繰り返していきました。しかし、そのような作業を長い間続けることはできません。いずれ打開策を模索していかなければならないからです。
 周期的にずれる謎のバグ。直したと思っても再発する。この状況でどうするのかといったって、原因がわからなければ何をどう対処して、どう検索したらいいのかわかりません。
 しかし、かれこれ30分格闘してきたうちに一つ気が付きました。既存の行はなぜかどうやってもずれないのです。そしてずれる行は下の方にありますから、上の行から"丁寧に"オートフィルでやればよくね?といった事実に気が付きました。実際にやるとあらびっくり。確かに修正ができました。地味な応急処置であるものの、関数をむやみに修正しなくても、操作一つで何とかできるようになりました。
 まだ完璧な解決はできていませんが、とにかく一つ目の難関は突破しました。しかし、今度はスタッフの人員不足が起きてしまいました。景品の抽選に1人、結果用紙の記入に1人いれば十分可能だと思われましたが、そんなことはなかったようです。結果用紙の記入に大体20秒しかかからないので、十分な回転率を維持できると考えましたが、所詮しょせんこれは理論値にしかすぎませんでした。実際には来場者への案内も兼ねてする必要もあれば、結果が出来上がって番号を呼んでも来ない人がいます。これは事前にシミュレーションしていた結果とかなりかけ離れていたので、仕方なく予備の人材を呼んでくるしかありませんでした。シフト表に非番を入れといてよかったなあと思ってます)
 といった感じでいたちごっこを繰り返していくうちに、少しずつではあるものの、状況は徐々に改善に向かいました。
 そして当日の夜、あることに気が付きます。

 これ、グーグルフォームが勝手に行を挿入しているからでは!?

 (それぞれの行にあった関数が離れ離れになっているのは先程伝えたとおりです)
 つまりなにが言いたいのかといいますと、関数と関数の間に無理やり行を挿し込んでいるから、このように関数がずれている現象が起きているのではないかという説です。
 実際にスプレッドシートの下の方にスクロールしてみるとこのことがよくわかります。行数がデフォルトで1000だったのに対し、いつの間にか1050になってました。もうこれは確信犯でしょう。
 家でなんとか解決できる方法はないのかといろいろ調べたものの、関数の再構築に数時間かかりそうだということが判明して断念しました。(今の応急処置で十分間に合っていたからというのもありました)そして、これはこれ以上関数とにらめっこするよりかは、明日の準備をしていくのがより重要だと考えたからです。

日進月歩

 (iii)文化祭の二日間、予想外のことにいろいろ対処してきました。
 まず、実施時期が真夏でしたので、チョコが溶けないように他のところから冷蔵庫を拝借いたしました。
 また、文化祭の終了時刻になって追い出された人のためにも、心理テストを家でもきるようにしようと思い、結果をメールアドレスに返却する仕組みを昼の休憩時間に急いで整えておきました。
 二日目からチラシの配布もし、チラシを持ってきた人には景品が2倍の確率で当たるという文言を付け加えて来場者に配布しました。
 おかげさまで約440人の回答が集まりました。一日目が200人なのに対し、二日目が200人ですので、この改善にどれほど効果があったのかがよくわかります。

 ただ、これだけでは満足しませんでした。まだ改善の余地がある。まだいろいろやってみたい。そう思い、私は(iv)のテストを実施しようと考えました。(厳密に言えば社研でやる文化祭企画が思い浮かばなかったのもありますが…)

4 軌道

 (iii)までに、色々なことを経験してきました。どれも重要なエッセンスばかりで、なにかが欠ければここまで至らなかったと思います。
 0を1にするクリエイター。1を10にするサポーター。10を12,13に改善させていく経営者。特に私は元からクリエイター素質であったので、この研究を10に近いレベルまで持ってこれたのは友人や大人のおかげでしょう。深く感謝いたします。
 10に乗れば、あとは少しずつ改善していくだけなのです。そのため、いままでの苦行が嘘みたいに身のもとに還元されていくように感じます。(だって、いままでの経験をもとに実行に移せるようになったのはとても大きいと感じるので。)
 (iv)に関しては、(iii)のままでも大丈夫でしたが、せっかくですので、より厳密で問題のないものにしようと考えました。
 以下、実際の改善例を示しておきます。

実る努力

 ちょっとした遊び心でもありますが、ダミー質問の一つとして、番号札の番号を素数だけにしてみました。(iii)ではスプレッドシートに番号を打ち込んでオートフィル機能を用いて1~1000まで埋めてたほどですので、素数もオートフィルでやろうかなと思いましたが、どうやらその機能はありませんでした。ということで、webを頼りにpythonで素数を出せるコードを書いてきました。ついでに縦に出力するようにしたので、素数の打ち込みは実質コピペだけで済ませることができました。
 また、未成年者がアンケートを受ける際は、親等の存在を確認するようなシステムを整えました。加えて、年齢別に応じて統計を行い、かつ質問の難易度や内容を変えようとしましたが、あまりにも煩雑すぎて断念しそうになりました。なんとかやり遂げようと思い、フローチャートを作って整理してみたらこのようになりました。

心理テストのフローチャート(α版)
実際(正式版)は厳密にやる必要があるのでこれよりもっと複雑である。

 Googleフォームは、一つのアンケートセットにおいて、数々の質問を用意できるのは有名なことですが、実はその質問らを一つのグループ(セクション)にすることもできるのです。要するに、アンケートセット>質問のグループ(セクション)>個々の質問、という順番になっています。
 つまりなにが言いたいのかといいますと、前のセクションで選んだ選択肢に応じて、次にどのセクションに行くのかを指定できるということです。たとえばここでは、上のフローチャートのように、年齢に関する質問で0-10歳を選べばイージー短縮版に、50-59歳を選べばこどもの確認のセクションまで自動で飛ばすことができるのです。(もちろん他の年齢を選べば他の指定された場所に飛ぶことができます。)
 上のフローチャートは、このようなことを示しているのです。

 また、今回は短縮版エゴグラムを少し改良しておきました。(iii)での各項目の点数が予想より少々高かったので、今回は逆転項目を入れておきました。要するに、本来7と答えれば7ポイント、6と答えれば6ポイントの質問が、7と答えれば1ポイント、6と答えれば2ポイントになっている質問のことです。
 ところで、MBTIに付いてご存知でしょうか。最近非常に有名になっている心理テストのうちの一種です。韓国で広まって、その後日本の若者の間で流行ったという流れで有名になったと言われています。あまりにも有名すぎたからか、去年(ii)(iii)からMBTI診断もできるようにしてほしいという意見が寄せられていました。しかし、以下の理由から実現が難しいと判断し、残念ながら断念することにいたしました。
 ・本家でやったほうが100%良い
 ・著作権とかがいろいろと危ない
 ・MBTIというテストそのものを勝手にパクれない
 ・問題が多すぎて、減らしてほしいというクレームが絶対来る
 ・24=16通りの結果があるため、結果用紙の不足及び結果の自動計算の設定が間に合わないことが推測される
 ・MBTIが過剰評価されているので、倫理的にあまりよろしくない。
 ・MBTIそのものに信憑性があまりない。(=オリジナルのものを作ったほうが良い)
 
 できれば採用したかったのですが、以上のように技術的・倫理的・時間的な面から実現は実質不可能だと考えました。ただ、その代わり、今年から「あなたを学生に例えたら診断!」を設置いたしました!
 この「あなたを学生に例えたら診断!」は、MBTIの代わりになる、社会科研究部オリジナルのテストとなります。判断の内容は非公開ですが、主に思考が自由奔放か自縄自縛か、物事の捉え方が直感的か論理的かといった数々の項目から成り立って構成されています。MBTIにちょっと似てるようで似てないようなテストですね...
 まあ、小学生であれば遊び心を持ち、大学生であれば将来への努力をする、みたいな診断です。

実際の結果用紙

 {ちなみにエゴグラム短縮版(等)の尺度がほしい方もいるかもしれないので説明しておきますが、今後文化祭でまた使う可能性があるので、部員のために非公開にすることに決定いたしました。ただ、どうしてもほしいのであれば、kibuyuna(at)gmail.comまでその旨を伝えるとうれしいです!できる範囲内で対応いたします。(atを@にしてください)}

 ところで、(iv)も昨年度(iii)と同じく全員分の景品を用意することにしました。特等賞(あたり)として"社研の考えた最強の景品詰め合わせ"を20-30人分用意しました。さらに、自作のくじ用箱を作って、中にあたりの分の数の紙とはずれの分の数の紙を入れ、抽選システムを整えました。これで当たり確率の低さもバレなくてすみます。(とはいえ、参加者全員に景品を配っているので低いというよりかは高い(100%)…?)
 まあ、乱数で下◯桁を照合するよりはましか…

 部活動勧誘のネタとして校外旅行を実施したためか、はたまたいままでの勧誘の方向性を変えたためかわかりませんが、今年の新入部員は結構真面目に働いてくれる人が多いです。イラストを書いてくれる方も3人いますので、今がチャンス!と思い、ポスター・チラシは任せました。ついでに社研Tシャツ・ロゴもできましたので、非常に嬉しいばかりです。おかげさまで、幽霊部員も0です!みんな、ありがとう!
 (iv)の結果は、入試が終わったらここに書こうと思います。来年度になっても更新されていなければ「あぁ、浪人したんだな」と思ってください。
 
 まぁ、浪人しないようになんとか頑張ります。

結果部分

A 各調査の概要

第一次調査(i)

 当時の高校生の私は「15歳にできるような内容なんか、ほとんど掘りつくされているだろう」と思い、他のアプローチをとってみるしかないと考えました。

 その方法は「総当たり法」です。(笑)
 (有識者から反論が来そうなので、誤解されないように具体的な方法を後で紹介しておきます。)
 まあ、いわゆる脳筋というやつです。
 もともと好奇心で始めたものだったので、結果はどうであれ思いついた仮説すべてを総当たりでかかってみようと思いました。こんな方法で何か結果が得られるんですか?と思った方もいるかもしれませんが、このような貴重な場所で"確実に何らかの結果が得られる"先行研究をまねするだけだともったいないなと思ったので、このような方法になってしまいました…(厳密的に言うのであればオリジナリティが出てしまっただけです)
 その反動によるものか、質問数も多くなってしまったので答える方も分析するほうも結構大変でした。(笑)


一つ目の調査のメインの仮説はこちらです。

 「ネットで言われるブーメランは頻繁に起こるものである。」

ネット上のスラングでブーメランというのは、他人に対しての意見(主に批判)が自分にも当てはまるようなことを指します。例えば、先進国が途上国に環境保護をすべきだ!と言っているような感じです。途上国からすれば、先進国のほうが環境保護をしていないんじゃね…?と思っているでしょう。

 メインの仮説の「ブーメラン」を検証するため、二人組以上でテストを受けさせることにしました。説明するよりかは見たほうが早いので実際の質問のうちいくつかを抜粋しておきますね。
 (※もちろんのことですが、一応述べておくとテストの回答は相手から見えないような状況で行いました。また、回答は匿名を使ったものとなっておりますので、ご安心ください)

<今、目の前にいる人(付添人)についてどう思うのか?(5段階評価)>

  • 思いやりがある人だと思う

  • 外交的な人だと思う

  • 自分と趣味や特技があっていると思う

  • 真面目でコツコツ努力する人だと思う

  • 専用用語をいつも使っている人だと思う

  • 同じやり方を何回もする方だと思う

  • 情緒不安定な人だと思う

  • 自分と気持ちや性格があっていると思う

  • 時間をきちんと守る人だと思う

  • 相手の話や冗談が笑えると思う

  • よく嘘に騙されていると思う

<今、あなたについてどう思っているのか?(5段階評価)>

  • 自分の思い通りにならないと怒ることがある

  • とても外交的だ

  • 他人の気持ちには共感できる

  • 真面目で、コツコツ努力する

  • 専用用語ばっか使う

  • 自分の顔には自信がある

  • よく嘘をつく方だ

  • 情緒不安定である

  • 過程よりも結果を重要視する

  • TwitterやInstagram等のSNSより、YouTube等の動画配信サイトの方をよく見ている

  • 自慢話をするのが好きだ

  • よく嘘に騙されている方だ

  • 同じやり方を何回もする方だ

  • 「新型コロナウイルス」に関する陰謀論を信じている

  • 「自分のせいではないよ」とよく言われる

  • 日中によく眠気を感じる方だ

<そのほかの質問>

  • あなたの得意教科を選んでください!

  • あなたは他人をどのくらい信用していますか?(十段階評価)

  • あなたは一日にどれくらいスマホを見ていますか?

  • あなたの好きな音楽ジャンルを教えてください!

  • あなたの好きなゲームジャンルを教えてください!

  • あなたの一日の睡眠時間を教えてください!

  • あなたの年代を知らせてください!

  • 相手との関係を教えてください!(友達、恋人、家族等)

  • 相手とは知り合って何年目ですか?(自由記述)

  • その他心理テスト"本体"にかかわるような内容(エゴグラム診断)

<外部文献(規約の元、そのまま拝借させていただたました)>

 総当たり法に使った項目のうちのいくつかを抜粋しましたが、実際に110くらいの質問があったと思います。今思えば相当狂っていました。
 結果の返却は「その他心理テスト"本体"にかかわるような内容(エゴグラム診断)」のうちの質問からそれぞれ点数を計算して結果を返却いたしました。このような感じです。

実際の結果用紙

 スクールカウンセラーの審査を受けているので結構甘口になっています。結果は個別にアドバイスすると倫理上危ないとのことでしたので、数字を書いて渡すくらいが限界だと言われました。
 ※エゴグラムを知らない方向け・・・人の自我状態(いわゆる心情とかもろもろ含めたやつ)を5つに分け、それぞれがどれくらい影響を及ぼしているのかを表したもの。IQとは違い、数字の大小によって優劣が決まることはないため倫理上適していると判断して採用しました。

 これだけで仮説を検証してもいいですが、できれば回答者の分布や偏りとかも見たかったので外部文献から「TIPI-J」という尺度(テストのツールだと思ってもらえば大丈夫です)を拝借いたしました。この「TIPI-J」は、「BIG5」という海外の100問程度の診断を日本語10問にまとめたという、まさに文化祭での時短のエキスパートでした。このような尺度を作ってくれた研究者の皆さんに感謝いたします。

 メインの仮説についてですが、先ほど述べた通り、二人組以上を呼んでで実験させるようにいたしました。二人組に対しては上の質問項目が書かれてある紙を渡し、三人組にはうち二人に上の質問項目が書いてある紙を渡し、もう一人には心理テストの部分のみが書かれてある紙を渡すようにしました。同じ人から他のサンプルを取ってみたかったので、心理学の知識をまとめた冊子を2回目参加者及び3回目参加者に渡すようにしました。結果の書き方には結構癖があり、結局は点数を合計してやらなければいけなかったため、暗算ですべてを足していく羽目にもなりました。(電卓も一応百均で買ってきましたが、3時間もしないうちに壊れてしまいました)
とざっくり手法をまとめてみましたが、結構複雑なことがお判りでしょうか。そのため、少々統計データの総数にばらつきがあったり、「~程度」みたいな書き方をしたりしますが、そういうことなんだなと思ってみてください。
 また、参加者の少なさと年齢のばらつきが特徴的なのは、当日の文化祭の性質に基づくものです。このデータは2022年に収録されたものですが、当時はコロナが流行っており、生徒と先生とその家族等に限定した限定公開となっておりました。こんなデータは意味がないじゃない!と思うかもしれませんが、最後まで見てくれるとその意味が理解できるのではないかな~と思っています。
 ということで本題に移りましょう。以下が参加者の属性です。

  • n=198 (うちTIPI-Jにおいての有効回答173件、ほかの部分も含めた有効回答は最高で179件)

  • 男86、女93名(その他と回答した方除く)

  • 13~19歳が最も多く、100名であった。

  • 次に1~12歳で23名。40~49歳で21名、50~59歳で20名だった。

  • 相手との関係は友達が76名、夫婦親子がそれぞれ28名、親友が21名、知り合いと恋人がそれぞれ6名だった。

  • 相手と知り合った年数の平均値が8.21年、中央値が4年、最頻値が1年であった。

(年齢の階級値の平均は23.96、標準偏差(いわゆる数値の散らばり)は15.82でした。)
※(i)セクションでは0-12歳を0代、13-19歳を10代と呼ぶことにします。

 多くの研究(小規模なアンケートに多い)は大学生にやらせるものや、SNSで募集したものが多いですが、こちらは10代及び40代の回答者を巻き込んでいるので比較的サンプルの幅が広いと言えるでしょう。
 調査数は198と、先ほど言った400よりだいぶ低くなっておりますが、これはそもそもこの企画があまり知らされなかったことに加えて、文化祭が限定公開だったこと、一人につき2.5時間の入場時間制限があったことなどが影響しております。
 次の章(B)では、この回答がどれだけ他の研究からブレがあるのかを確認するために、TIPI-Jについての論文(以降この見出し内では先行研究と呼びます)で公表されているデータと照らし合わせてみます。

第二次調査(ii)

 ここからは、2023年春に行われた校内向けのアンケート内容について紹介します。
なお、アンケートは教員用の校内向け連絡網に流したものであり、快く許可をしてくれた顧問や学年主任方に深く感謝いたします。

  • 質問はエゴグラム短縮版の作成案である20問、TIPI-Jの10問、対象者に関する基本的な質問数問(ダミー質問含む)、次回調査に向けての予備質問数問、本調査に対する同意の項目で成り立っている。

  • 質問の中には、読解力を測るような質問も入っている。(AI VS 教科書が読めない子供たた(リンクはアマゾン)で紹介された"RST"をアレンジした設問。詳しくは"アミラーゼ問題"(リンクは東洋経済オンライン)と検索)また、表示された文章がAIかどうかを判断するような質問もある。

  • 質問は校内だけではなく、実はツイッター(X)でも募集している。(だが、校外から来たとみられる者があまりにも少なすぎたので分析はそのような人(主に10代以外の年代)を省いている。)

  • 調査数は120で、(上記の対象を無効回答とすると)有効回答は107件であった。(全て10代=10~19歳)

 毎度すごい量の調査数ですが、実はこれには予算内で懸命にやりくりした壮大な背景があります。それはまた後で解説しておきますね。

(参考:ダミー質問・・・答えられて当たり前のことを聞いて、適当に回答を選んでいる人を弾くための質問。例:1+1=? と質問→ "99999" と回答した人は失格=無効となる)

独自心理テストの作成

 ストーリー部分で若干触れましたが、エゴグラム短縮版の作成案については非常に非常に非常に頑張って考えました。既存のエゴグラムの質問をそのまま使うのもどうなのかと思いましたので、なるべく他の物とは違う、既存の物に似ている物を作ろうと頑張りました。その努力の結晶がこの20問で、結果次第では泣いても笑っても10問捨てなければなりませんでした。
 TIPI-Jのものについてはなんとなく入れたものではなく、本番のアンケート調査でこちらが用意した質問との相関係数が高ければ、こちらの質問の意義が薄くなるといった事由で入れました。中には相関係数が0.50にのぼるものもあったので、入れてよかったなと思っています。(しかも、気になる相関を見つけられました)

 ということで、エゴグラム短縮版の作成過程について見ていきましょう。20問に絞ってアンケート調査を取った後の過程です。

①非正規分布のものはなるべく外す

 正規分布とは非常にざっくり言うと真ん中が山になっているもののことです。自然のほとんどの物は正規分布です。そしてその逆を文字通り非正規分布と言います。実物を見たほうがわかりやすいでしょう。

実際の回答の分布(非正規分布)

 こちらは実際の質問で、明らかにどう見ても正規分布ではないことがよくわかります。ネット上にある情報だけではなく、エゴグラムについて解説した本を参考にしてまで作った質問ですが、このような非正規分布が出てきてしまうのはびっくりしました。
 …と思って質問内容を見てみたら、「他人に気をかけてもらうと嬉しいほうだ」と書いてありました。
「たしかにそうなるわな…」
 と思ってしまいました。気づけなかった自分が悔しい。ということでこの質問は没になりました。

実際の回答の分布(正規分布)

 ふむ。これはいい感じの正規分布になっていますね。ということでこの質問は採用しました。あと、3番が凹んでいて、ラクダの二つのこぶみたいなグラフになっているものもありましたが、これはどちらかのほうに回答しようと努めたと考えられましたので様子見で採用しました。

②様々な組み合わせを考える

 ①ではまだ足りません。ここから同じような質問項目を削っていきます。4つの質問ですから、数学で4$${C_2}$$通りの組み合わせがあると考えられます。すなわち6つの組み合わせです。この6つの組み合わせでお得意の総当たり法をしていきます。

実際の当たり屋の現場

 黄色い所が採用したセットを表し、赤い所が入れるのかを相当迷ったセットです。下限、上限はそれぞれ95%信頼区間を表し、相関はややこしいですが、4つの質問で得られた得点とこのセットの得点の相関を示しております。つまり、相関が高いほど信憑性が高い可能性を示しているのです。(とはいえ、どちらもこちらのオリジナル作問ですので信憑性もなにもないですが…)
 もとからある50個分のエゴグラムを引っ張ってきてそれと比べるのも一つの手段かなと思いましたが、事前アンケートで質問できるような量ではないので断念しました。また、50個分のエゴグラムとはいいつつ、評価や尺度がサイトによってばらばらであることを考慮すると、こちらで作成したほうが実は合理的なのではないかと判断したので導入は諦めておきました。

 所詮しょせんジョークですので、(結果が返却されますので)質問項目に関しては平均が高めのものを採用しても問題はないと判断しました。
 標準偏差はどれもほぼ同じでしたので、特に問題はないと考えました。
 歪度や尖度に関してはどちらも0に近づけば正規分布に近いグラフが見られますので、極端なものは避けて選びました。
 相関についてはなるべく高いものを選びましたが、一部低いものも選んでおります。これは、前のに加えて新規テストの診断項目にそぐわないこと(後述)、セット(=2つ)の質問項目の相関が正に強く過ぎることと、TIPI-Jとの関連が強いものがあったことを考慮したためです。また、比べる対象がもともと4つの項目の足し算ですので、相関が低くても支障は大きくないと考えました。

各項目と各項目の相関関係
(この中からなるべく相関係数の低いものを選んでいます。)

 といった感じで、ジョークらしきものの尺度(?)を得ることができました。この後部員にやってみましたが、意外と当たっているという意見があってびっくりしました。これはバーナム効果による影響なのか、はたまたほんとに当たっているのかに関してはよくわかりませんが、何よりも楽しめるものであったようでよかったです。

(※バーナム効果・・・誰にでも当てはまるようなことを自分だけに当てはまっているように感じる現象。
例えば、「あなたは他人に気に入られたいでしょう」という内容が心理テストで返ってきたとしよう。そうすればあなたは「この内容は自分に向けたものなんだな」と思うかもしれませんが、実際はこの内容はほぼ全人類に当てはまるような内容です。世界中のほとんど(90%以上)の人間は他人に気に入られたいはずです。このような手法は心理テストに限らず、占いなどにもよく見られます。)

第三次調査(iii)

第三次調査についての概要はこちらです。

  • 調査数は476件で、0代を除いた回答かつ有効であったものは396個。

  • 教室は自習室で行われ、広い会場でありかつ机に仕切りが設けてあります。図書室からPCの貸し出しもできました。

  • 質問の中には、読解力を測るような質問も入っています。(AI VS 教科書が読めない子供たた(リンクはアマゾン)で紹介された"RST"をアレンジした設問です。詳しくは"アミラーゼ問題"(東洋経済オンライン)と検索してください。)また、表示された文章がAIかどうかを判断するような質問もあります。

  • 調査人数を増やすために、今回は二人組ではなく一人でもできるようにしてあります。ただ、ペアでの来場者も多かったことから、工夫次第では二人組で行ってもそれほど支障は大きくないと考えられます。

  • アンケートを家でも答えられるように整備しました。

  • 参加者全員には景品を配りました。(家で答えた人を除く)

 (iii)に関しては、全体的に挑戦と変革のようなテストとなった気がします。何かをやるまで検討しても無駄なので、リスクのないことは何があっても真っ先にやるようにしています。それが今回のテストであり、80問という量の中にすべて収めてあります。
 結果用紙も見やすいように刷新しました。

実際の結果用紙の一部

 これ、一回目のものと比べてほしいですが、明らかにデッドスペースがなくなっているのにお気づきでしょうか。今回の結果用紙では、なるべく特別感を与えられるように若干賞状風にしてあります。(笑)
 また、SNSにあげることも許可しているので、よければ拡散してほしいな…と当日は思ってました。それくらい思い入れのある(?)結果用紙となっております。

 それはさておき、結果の概要についても一応確認してみましょう。

当たり屋の現場
水色|r|>0.3, 赤色|r|>0.5
※|x|は絶対値(xと0との差)を表す。ここでは|x|>?であれば、-?<x<?を示すと思ってよい。

 ところどころメモ書きが残ってありますが、こちらが用意した質問のうち17-29番は多くの相関が見られます。
 21-35番の質問の内容はこちらです。(※11-20番の質問は短縮版エゴグラム)

  • 友達が多いほうだと思う。

  • AIが作った文章か、人間が作った文章かの識別ができる。

  • 他人が大きなミスを犯しても、わざとでなければ素直に許すタイプだ。

  • 喧嘩などの仲裁を、お互いの話を聞いてする方だ。

  • 状況を素早く判断できる方だと思う。

  • オリジナルのアイデアを作るのが得意だ。

  • 自分の中で満足するだけではなく、他人から評価されるような人になりたい。

  • 少々情緒不安定である。

  • 他人に気にかけてもらうと嬉しい方だ。

  • 新型コロナウイルスに関する陰謀論を信じている。

  • 自分の顔には自信があるほうだ。

  • 同じやり方を何回もするほうだ。

  • 日中に眠気を感じやすいタイプだ。

  • 心理テストや心理学に興味がある。

  • 金銭管理が苦手なほうだ。

 ※とくに述べることもないので割愛しますが、36-40番の質問は、あなたの知り合いについてどう思うのかの質問です。

 以上から分かる通り、相関が多かったのは主に交友関係に関するものでしょう。後半は完全に自分についての質問事項なので、相関が少ないのは納得できます。
 Hの第一見出しにて似たような内容を考察します(というかこの記事の校正前では順番が逆だったから過去形のほうがふさわしい)が、基本的に人間関係全般については、自分の感情が細分化されていないのが正しいかもしれません。というか今までに交友関係についての自分の思いを細分化した人ってどれくらいいるのでしょうかね…
 それか、自分の理想に近づこうとするための結果としても考えられなくもないですが、後半部分で全くと言ってもいいほど相関が出てないのでこの仮説は若干弱い気がします。

 なお、外れ値についても検定してみましたが、平日のスマホの利用時間以外外れ値は見られませんでした。というかそもそも平日のスマホの利用時間自体おそらくほとんどの人が2,3時間に収まっていると思いますので、仕方のないことだと思います。

 Dセクションでも解説していますが、この世の中のほとんどの自然現象は正規分布とされています。

正規分布のイメージ
By M. W. Toews - Own work, based (in concept) on figure by Jeremy Kemp, on 2005-02-09, CC BY 2.5, https://commons.wikimedia.org/w/index.php?curid=1903871

 実は、これから扱う数値が正規分布なのかどうかによって、用いる統計手段が大幅に異なってきます。
 そのため、分析や統計の段階の前に正規分布かどうかを判別することも必要になってきます。
 では、みなさんにクイズです。このグラフは正規分布でしょうか?

実際のデータを基に作成したグラフ
先述&後述の精神症的傾向のヒストグラムである。

 正規分布に近い形をしていますよね?
 でも、違うんです。これは非正規分布だと判別されます。

 え?と思うかもしれませんが、本当です。
 Shapiro-Wilk normality testというすごそうな正規分布かどうかをチェックできる数式を用いて、このデータを分析にかけてみると、p=0.000004448 になるのです。pとはなんぞや?と思うかもしれませんが、まあ正規分布の仲間だと思ってください。出現する場所によって異なりますが、ここではp<0.05となっていれば正規分布ではない、と言われています。先ほど出したp値は、明らかに0.05からかけ離れています。
 何の間違いかと思い、他の項目も検証してみましたが、実は正規分布だといえるものはほとんどありませんでした。というかほぼないに等しかったです。

非正規分布と判断されたもの。p=0.000003599

 なんでなんだろうな、と思い、ネット上で各種情報を探してみました。すると・・・

注記:正規性検定の種類によってはp値が発生することがあります。こういったものは正常値から少しずれるだけでも過剰に反応してしまう傾向があるため、薦められません。通常の確率プロット(Q-Qプロット)のデータを見るのが最も信頼性の高い方法です。ここで柱状のグラフを用いたのは、釣り鐘型の形がわかりやすいからです。

正規分布にならない例や理由 NPSの非正規分布は信頼できるデータ?(Web担当者Forum)
2024/6/2閲覧

 「正常値から少しずれるだけでも過剰に反応する…」
 ところでQ-Qプロットとはなんぞや?と思うかもしれませんが、まあこういうことです。

観測値が正規分布に従う場合の期待値をY軸にとり、観測値そのものをX軸にとった確率プロット。

観測値を昇順に並べた順位からパーセンタイル(累積確率)を求め、正規分布の確率密度関数の逆関数を用いて期待値を予測する。プロットが一直線上に並べば、観測値は正規分布に従っていると考えられる。

統計WEB 正規Q-Qプロット より

 先ほどの文とは異なり、結構な読解力がいるような文章になりましたが、要するにQ-Qプロットは上の正規分布のグラフの姉妹で、一直線になれば正規分布だと考えられるということです。
 実際にやってみたほうが早いでしょう。

1番目のグラフ(精神的)をQ-Qプロットで表したもの

 きれいに一直線に並んでいるな、と思ったそこのあなた。違います。
 なんでや?と思うかもしれませんが、よくよくみると点が青いゾーンから離れているということにお気づきでしょうか。実は、問題はここにあるのです。
 非正規分布という結果になったのは、データが悪いわけでもなく、分析手段が悪いわけでもなく、ただ単に14段階でしか統計を取ってないからだということがここから考察できます。
 これを無理やり140段階とかにしれアンケートをとれば、恐らくほとんどの項目が青いゾーンに収まっていることになるしょう。←想像力を働かせて考えてみてください。
 ただ、140段階にするとそれはそれで問題なので、多分これをやる人はあまり出てこないと思います。(あったらあったで面白そうですが…w)

 「正常値から少しずれるだけでも過剰に反応する…」

 これが大きなカギを握るかもしれません。所詮しょせん整数でしか表されない回答は、計算上正常値から大きくずれてしまうのは仕方ないことだと言えます。(あと純粋にサンプル数が多ければ多いほど正規分布に近づくなどの要因もありますが…)

 なにがともあれ、数式による検定であればほとんどの項目が非正規分布として認識&弾かれてしまうので、ここでは主にグラフを用いて正規分布or非正規分布かを調べていこうかと思っています。あやしいものであれば、両方だと仮定して考察を進めていきます。

 あと、少々難しい話題になりますが、正規分布であればパラメトリック検定、非正規分布であればノンパラメトリック検定を用いて何かしらの検定するのが主流となっているようです。今後、第三次検定(iii)以降ではこれらの単語を使っていきますので、急に出てきても対応できるようにしてもらえばありがたいです。
 なお、ノンパラメトリック検定はいつでもどこでも使える検定なのに対し、パラメトリック検定は正規分布の時でしか使えません。(そのかわり精度↑)一応(iii)以降は両方の検定の値を載せておきますが、以上のことを参考にしても構いません。
 ちなみに個人的には両者の違いとして、代表的なのは平均値での検定か中央値での検定があげられると思います。正規分布(パラメトリック検定)であれば平均値を用いることで各スコアの重心が捉えられますが、非正規分布(ノンパラメトリック検定)であれば中央値を用いることで各スコアの真ん中を知ることができます。あくまでも個人の感想ですので参考までに。

 さて、次のセクションに進みましょう!

B TIPI-Jとの関係

第一次調査(i)

(i)での回答と、TIPI-Jの元論文(ここでは先行研究と呼ぶ)での回答分析の結果
白色→今回のテストの数値 / 灰色→TIPI-Jについての論文で公表された数値
統計はスプレッドシート及びEZRによるもの。
EZR紹介論文↓
Kanda Y. Investigation of the freely-available easy-to-use software “EZR” (Easy R) for medical statistics. Bone Marrow Transplant. 2013:48,452-458. advance online publication 3 December 2012; doi: 10.1038/bmt.2012.244


 読めない方、ご安心ください。当時の高1の私はこの図を見て「95%信頼区間、、、?なにそれおいしいの、、、?」という状態でした。
「95%の確率で他人から信頼されている…?さぞかしコミュ力が高い人だな…」
 冗談はさておき、ここからは素人でもわかるように解説をしていきますね。
Mは平均値、SEは標準"誤差"です。標準誤差とは何ぞや?と思うかもしれませんが、標準偏差の仲間だと思ってください。ただ、小さいほうが精度が良いと言われています。(調査数が多ければ多いほど標準誤差は小さくなる)ちょっと飛ばして、標準偏差SDとは、点数がどれくらい散らばっているのか、ということです。全員が同じ点数を取れば標準偏差は0になり、一人がマイナス9999999点、もう一人がプラス9999999点を取れば標準偏差(誤差)は大きな値(数字)になります。
 戻って95%信頼区間は、「全人類に調査をとったら、まあ大体ここら辺が平均になるんじゃね!?」みたいな感じだと思ってもらえば結構です。ちなみに95%以外の残りの5%はなんなのかというと、「ごめん、うちがとったデータ。ちょっとハズレで全人類に調査をとったときにどうなるのかわからないよ…」が5%の確率で発生すると思ってもらえば大丈夫です。
 歪度、尖度に関しては、グラフにしたときにどれくらい左右に傾いているのか、どれくらい尖っているのかというくらいの認識で構いません。下にグラフをのせてありますので、そこをみてくれればなんとなくわかると思います。
 相関係数は、数字がめっちゃ大きければなんかこいつら姉妹なんだな~って思っておいてください。マイナスでめっちゃ小さければこいつらお互いの親を殺したんだな~って思っておいてください。(関係がめっちゃ悪いカップルみたいな感じ)このような例えを使うと「相関関係はそういうもんじゃねえぞ!」と怒られるかもしれませんが、まあわかりやすく説明しているだけなので許してください。
 (一応大人のために解説:相関係数の大きさ(=相関関係)は因果関係と関連性が必ずあるとは限りません。夏になればアイスの売り上げも上がりますし、夏になれば海で溺死する人も増えます。では、アイスの売り上げと海での溺死数の相関関係を取ってみるとどうなるのでしょうか。
 あら不思議、アイスの売り上げと海での溺死数においての相関係数が"0.6"という高い値を示すのです。(※相関係数は-1から1までの間にある)これを因果関係に捉えてしまうと、相関係数がちゃんと大きくなってるからこれは相関があるに違いない!つまりアイスを売れば売るほど海で死ぬ人が増えるんだな!という陰謀論を生むきっかけにもなってしまいます。ちなみにこのようなエセ関係を"疑似相関"と呼びます。)

 左下のnは調査数の合計で、このTIPI-Jにおいての調査では173人が参加してくれました。右下のpの値は、相関係数のツレのようなもので、こちらは小さければ小さいほどいいと思っておいてください。なお、p値は、調査数が少なければ少ないほど高い値が出てきやすいです。(参考までにTIPI-Jについての論文では長崎の大学生902名を対象にしていました)

 ここまでが説明です。ここから分析に移りたいと思います。
 私はこう思いました。
 「あかん、p値が高すぎる。「*」があまりにも少なすぎる。朝食はこめ派なんだけどな…」
 と一瞬(気温が下がってしまいそうなことを)思ってしまいましたが、これは調査数の関係上あらかた仕方のない部分だと言えるでしょう。実際にこちらにあるデータでp値を取ってみると、多少の誤差はありますが、p値の大きさの分布はほとんど先行研究と一緒でした。これはある程度不可抗力ですので仕方のないことでしょう。
 見るべきところは平均でしょうか。驚くべきことに、「外向性」「開放性」が先行研究と比較してかなり高くなっております。そして「精神症的傾向」が低くなっています。
 文化祭で来る人は基本的に外向的で開放的なので、そのような状況においてこの点数はたしかに妥当だと思います。むしろ怖いというくらいこの点数が当てはまっているように感じました。
 同時に精神症的傾向も低くなっていますが(誤解を恐れずに言うのであれば、この数字が高いほど精神的に病んでしまう傾向にあります)、これについてあくまで推測の範囲内で語るとするならば、外向的な人ほど精神症的傾向が低くなっているということなのでしょう。ただし、相関係数はそこまで高くなかったので(-0.09)、他にも要因があるのではないかなーと考えています。有識者の皆さん、良ければ意見をお聞かせください。
 以上の点が文化祭でアンケートを集めたときに現れる唯一にして最大の欠点でしょう。回答にばらつきがあるのはしょうがないことですので、気になった方は(できるのであれば)各自で追試等をしてくれればこのデータの信憑性は検証できると思います。ただ、他については申し分のない結果を出してくれていますのでそちらについても見ていこうと思います。

参考:各項目においての点数分布
こちらから先行研究のほうのグラフも見ることができます。

 追記:これ、先行研究と比較してみたら結構面白いことがわかってしまいました。例えば勤勉性のところ。先行研究では一つ山になっているのに対し、こちらでは二つ山があるように見えます。これの原因について追及してみたところ、次のようなことがわかりました。

それぞれの年代の結果
上から見て
真ん中が平均値(標準偏差)
下が中央値[四分位数]となっている。
※小数点以下が存在するのは中央値計算上の仕様
※60代以降のデータは少なかったため省いてある

年代別の平均値をグラフにすると・・・

年齢と各項目のスコアの関係

 やば!?
 
外向性の出っ張りが半端でないほど大きいということがよくわかります。あと勤勉性。これはもはや犯罪でしょ、というレベルの坂になっています。もう少し傾きをふやしたらサスケの種目に登場しそうなくらいです。それと同時に精神症的傾向も下がっておりますから、やはり先ほどたてた仮説は正しいということになるのかもしれません。
 (ちなみに30代のデータは6しかないので、あまり信憑性がないのかもしれません。ただ、いずれにせよ10代と40代で平均の値が変わっていることは確かでしょう。)

年齢と勤勉性の関係

 これと上の青い棒グラフを照らし合わせてみると一目瞭然です。上の「それぞれの年代の結果」においての中央値が5か8という雲泥の差を軽く証明してくれました。参考までに他のグラフも載せておきます。

参考:相手との関係と各項目の得点の平均点及び中央値
参考:相手との関係と各項目の得点の平均点をグラフにしたもの
(折れ線グラフにしたのは他項目と被らないようにするためです)

 みなさんお気づきかもしれませんが、まだ本題の仮説の解説に進んでいません。今回の結果を熱く語ってしまったので、全然話題が進行しないどころか、まだ言いたいことの半分も伝えきれていません。正直言ってここらへんはまだ深堀のしようがあると思いますので、いつか論文とかになったらまたここにて紹介しようと考えています。

第二次調査(ii)

年齢や調査場所(高校)によるものか、協調性の尖度がTIPI-Jの本論文から離れている。
(計算にエラーがないことは確認済み)

 特に解説することはないですが、回答数が少ないのでp値が高くなっていますね。こればかりはどうしようもないので次回調査に任せるとします。
 なお、校内向けだったため、年代は10代がほとんどとなっています。他集団との比較を特に行う必要はないと考えたので、ひとまず(iii)にバトンタッチする形とします。

※精神症的傾向が先行研究と同じくらいの値になっています。外向性は相変わらず高いので驚きでした。

 参考として、平日・休日の睡眠時間が長い人ほど外向性が高かった結果も出ていましたが、p値が0.01どころか0.1を超えていたので没になりました。(というか(i)ではこのような結果は見られなかった)

第三次調査(iii)

 調査数が多いのでp値もしっかりと低くなっています。(←嬉しい)個人的にはp値がとても低いorとても高いの二極だったと感じました。理由はよくわかりませんが、先行研究と似たテーブル(図表)になっていますので、多分もとからの原因だと思います…
 ただ、サンプルが文化祭の来場者ということもあり、平均等の値がちょっと偏ってしまっています。ただ、このような調査においてのサンプルの完全な無作為抽出(全人類をくじ箱の中に入れて適当に引くようなイメージ)はそもそも無理ですし、やはり参加者に対してポイント等の報酬が与えられているところが多いと思います。スマホでできるポイ活もそのような系統のアンケートが多いでしょう。(一部ボランティア参加もあると思いますが、それのみを抽出してしまうとただの慈悲深い人たちのサンプルになってしまいますので…)
 まあ、ちょっとおおめに見てあげてください…

各年代における結果表記は:平均値(標準偏差)
※0代のデータは、被験者の読解力を考慮し、省いてある。
年代(横軸)と各項目(縦軸)の関係

 見た感じ、今回は特に年代別に何かがあるわけでもなさそうです。
あまり目立っていませんが、精神症的傾向が若干右肩下がりになっています。
 この差が有意なものなのかについて、ここからはt検定というものを行ってみようと思います。
 まず、帰無仮説は10代と40代の精神症的傾向の平均値は等しいとします。そして、t検定というものを行うと、p=0.0844となりました。有意水準0.05とすれば、p≧0.05より、帰無仮説は棄却できない。
 意味わからん単語ばっか出て困惑しているかもしれませんが、要するに、10代と40代の精神症的傾向の平均値は等しいということは、否定できない(=もしかしたら正しい)結果が出ただけです。帰無仮説は、"等しい"ことについての仮説です。ちなみに、対立仮説というものもあって、こちらは""差があることについての仮説となります。p<0.05であれば、"対立仮説"(差があること)を採択(判断)できます。※有意水準5%の場合
 念のためノンパラメトリック検定もやってみましょう。仮説は一緒としてやると、p=0.0668になりました。んー…
 サンプルサイズ、もう少し増やしたほうがよかったかもしれません。(←覆せない運命)

参考

 ただ、さっきのはあくまでも2群間でのt検定となっています。サンプルサイズの大きい10代と40代のみを抜き出した結果ですので、まだ20代とかを巻き込めていません。しかし、3群以上でのt検定には少々無理があります。どうすればいいのでしょうか。
 安心してください。ちゃんとそれ専用のものがあります。一元配置分散分析というそうです。特に用語まで覚える必要はありませんが、なんかすごそうなやつを使うんだなと思ってください。そしてこのなかでもTukey法というものを使っていきます。rを付け加えればすごくおいしそうですが、残念ながら違います。
 やり方は脳筋です。ぼくみたいに総当たり(10VS20, 10VS30, 10VS40, … , 40VS60, 50VS60)で臨み、その結果を反映させるというものです。

各項目とのバトル&95%信頼区間

 要するにこういうことです。本当にそれぞれとそれぞれをバトルさせてますね。そして、20-10, 30-10, 40-10になるたびに平均値(mean)が下がってますね。p値の結果も見ていきましょうか。

pは一番右

 ・・・
 これどうなってます?
 p値が全然低くないのですが。
 どうやら、Tukey法では、バトルさせすぎてしまうとまぐれで勝ち負けの判定ミスが発生しやすくなるため、それを防ぐためにp値(判定基準)が上がってしまうようです。

参考:One-way ANOVA検定の結果
参考:年代と精神症的傾向の関係

 念のため、ノンパラメトリック検定(Kruskal-Wallis検定)も行ってみます。

 、、、多分無理ですね。
 これ以上はサンプルを増やす必要があるかもしれません。みなさんの協力が必要となってきます。。。

 参考:各項目のヒストグラム

参考:各項目と年齢の関係
10代があまりにも多すぎた。


C ブーメランは果たして存在するのか?

 (i)でのメイン仮説についてです。

概要

 結論から言います。存在しませんでした。
 某法律事務所並みに早い結論でしたが、残念ながらそうとしか言いようがなかったのです。
 しかしまだあきらめてはいません。各項目ごとに相関を取ってみたら、実は一部の項目にてちゃんと有意な値を示してくれたのです!

 (一応手法のご紹介:自分が相手に対してどう思っているのかを5段階で評価するのと同時に、相手が自分に対してどう思っているのかを5段階で評価し、双方の点数を隣同士に並べて相関をとりました。)

 今回、5つの項目において相関(相関係数0.3以上)が取れています。それがこちらです!↓(相関係数は"r"で、専門用語rs,ps等は後で解説します)

  • 相手と知り合って何年目ですか?(r=0.79 p<0.001 rs=0.19 ps=0.119)

  • (相手が)自分と趣味や特技があっていると思う(r=0.44 p=0.000123)

  • (相手と)口論がおきたことがある(r=0.49 p=0.0000162)

  • (相手と)と旅行に行ったりしている(r=0.41 p=0.000377)

  • (自分に関しての質問)休日のスマホ利用時間を教えてください。(r=0.34 p=0.00351 rs=0.23 ps=0.0532)

 最初の4つは当たり前ですよね。最初から2番目の項目に関しては、正直言って結構面白いな~と思ってたりしました。どっかの心理学者が言った通り、人間ってやはり最終的には趣味の合う人と付き合うんだな~ってことがよくわかりました。

参考:横軸が相手と知り合ってからの年数
縦軸が相手と趣味や特技があっていると評価をした点数
横軸が相手と知り合ってからの年数
なお、サンプルサイズ(=日常用語に訳すと"サンプル数"(調査数))が2以下のものは除外している。なお、相関係数r=0.301 だった。
「相手と趣味や特技があっていると思う」の散布図
(上に書かれてあるo.ooo^x+?.??は、回帰直線の式である。一般の方は特に気にしなくてよい。)

 そして、これ(下の散布図)。相手とスマホの利用時間が相関していることってありえますかね?やはり夜一緒にゲームをしているからなのでしょうか?夜に寝落ち通話をしているからなのでしょうか?私にはよくわかりません。


休日のスマホ利用時間の散布図 (p=0.00351)

 これがなぜ成り立つのかについてはもう少し研究が必要ですが、めちゃくちゃ面白いと思いませんか?平日のスマホ利用時間はほとんど相関がないのに、休日のスマホ利用時間にだけ相関が出ています。それどころか、他の約100項目は相関すら出ていません。外れ値とか特段あるわけでもないので、偶然の確率は比較的低いんじゃないかなーと思っています。

参考:平日のスマホの利用時間の散布図 (r=0.03 p=0.803)
※ちなみに5時間以下の使用者に限定して相関係数を出してみても
約0.13にしかなりませんでした。

 ちなみに睡眠時間にも相関あるんじゃない?と思ったそこのあなた。一応相関係数を出してみたら、平日と休日でそれぞれ0.20と0.11になっていたので、うーんという感じです。

相手との平日の睡眠時間の関係 (p=0.10)
(縦軸と横軸の隣に書かれてある文字は質問番号ですので、あまり気にしないでください)
相手との休日の睡眠時間の関係 (p=0.37)

というわけで
結論:日常で起こるブーメラン(?)は休日のスマホの利用時間に多い!
(というかこれそもそもブーメランではない…)

 まあ、「相手と趣味や特技があっていると思う」の相関係数が比較的大きかったので個人的には満足です。他の項目はほとんど相関係数がないようなものだったので、人間って不思議だな~と自然と思ってしまいました。

他の可能性

 今回は自分から他人への評価と他人から自分への評価についての相関を調べてみましたが、これが自分から他人への評価と自分から自分への評価になるとどのようにかかわってくるのでしょうか(前者)。また他人から自分への評価と自分から自分への評価とどのようにかかわってくるのでしょうか(後者)。

 前者は全項目において一つ一つ相関を取ってみました。すると有意なものは 2つしか得られませんでした。(悲しいですね)
 得られた結果を以下に記しておきます。

  • 相手を情緒不安定だと思っている人ほど、自分のことを情緒不安定だと思っていた。(0.33)

  • 相手を「同じやり方をしがちである」と判断した人ほど、実際に自分のことを「同じやり方をしがちだ」と考えている(0.31)

 一つ目の結果のなにがすごいのかというと、TIPI-Jの精神症的傾向は全くと言っていいほど相手と相関がなかったのです。(0.02)つまり、ただの思い込みだったということです。
 二つ目の結果については正直言って謎です。ここら辺に関してはおそらく追研究が必要でしょうか。趣味とか特技にも関係してきそうなところです。
 ちなみに、同じような質問を繰り返し聞いているからそうなるんじゃないの?と思っている方もいますが、意外とそんなことはないです。

相関係数一覧(実際の画像)
※絶対値が0.3以上のものについては色分けをしている。

 上の表を見ればわかるとおり、正の値を取っている相関係数は意外と多くないことがわかります。例えば、上から5番目でかつ左から5番目の項目は「真面目で、コツコツ努力する」というものになっていますが、相関係数は0.11と有意とは言えない値になっていました。さらには、上からかつ左から14番目の項目は「冗談が面白い」という項目になっていますが、こちらは相関係数が-0.25でした。むしろ逆に言うならばおやじギャグには気を付けたほうがいいような値になっています。

 では後者。こちらは統計を取るのにかなり苦労しました。とりあえず相関がありそうなところに目星をつけて取ったりしたら、こちらのような結果が得られました。

  • 自分のことを外交的だと思っている人ほど、実際に他人から外交的だと思われている。(r=0.35)

 ここの情報に詳しい方がいらっしゃいましたらご恐縮ですが、おそらく(多分ですが)これ当たり前のことだったりしますよね…
(心理テストに限らず、尺度そのものは他人からどう思われているのかを自分からの回答で推測し、そこから結果を出すような感じですので…)

 それとは別に、実際にTIPI-Jの自分と他人評価の相関も調べてみました。結果はr=0.37と、有意な結果が得られました。(p=0.0055)
 ただ、相手に対しての聞き方と自分に対しての聞き方が違います。要するに、質問のニュアンスが少し違うということです。この値はあくまでも参考までにしておいてください。

D 他の先行研究はどうなの?

第一次調査(i)~SNS VS 動画サイト & 陰謀論 VS ダークトライアド ~

 実は先行研究の内容を少し入り混ぜたものも入っておりました。例えばこちらの質問。

  • TwitterやInstagram等のSNSより、YouTube等の動画配信サイトの方をよく見ている

  • 「新型コロナウイルス」に関する陰謀論を信じている

 まずは一つ目の項目。これはイギリスの公衆衛生王立協会が調査したものをこちらで若干改変して使用しております。

In May 2017, RSPH and the Young Health Movement published a report examining the positive and negative effects of social media on young people’s health

The report includes a league table of social media platforms according to their impact on young people’s mental health. YouTube topped the table as the most positive, with Instagram and Snapchat coming out as the most detrimental to young people’s mental health and wellbeing

RSPH #statusofmind
※RSPH:Royal Society for Public Health UK(王立公衆衛生協会)

 こちらについてはBBCが解説しておりますので、英語が読めない方はこちらを見ていただければなと思います。(※メンタリストDaigoも解説してます)
 めんどくさい方向けに解説しますと、要するに「YouTubeとかのSNSが若者に対してどのくらい影響を与えるのかな~って研究してたらYouTubeのほうが若者に影響をあんまり与えないということがわかって、かつInstagramのようなSNSアプリは負の影響を大きく与えるということが分かった」という感じの研究です。

 二つ目はこれ。なんで急に陰謀論なんだ?と思うかもしれませんが、安心してください。ちゃんとした研究データがあるんです。
 ウォータールー大学の研究によると、知性が低い人ほどスピリチュアルなものを信じやすいという結果が出ているだそうです。(※スピリチュアル・・・幽霊とかの、科学的根拠の薄いもの)
 確かに、我々の言う知性のある人は、それこそ探求の1つとして神社に行ったり占いとかを受けてみたりするけれども、結果をあくまでも参考にしかと留めていない印象がありますよね。(私です)

(個人差はあるものの・・・↓)

Those more receptive to bullshit are less reflective, lower in cognitive ability (i.e., verbal and fluid intelligence, numeracy), are more prone to ontological confusions and conspiratorial ideation, are more likely to hold religious and paranormal beliefs, and are more likely to endorse complementary and alternative medicine.

Gordon Pennycook, James Allan Cheyne, Nathaniel Barr, Derek J. Koehler and Jonathan A. Fugelsang
On the reception and detection of pseudo-profound bullshit (2024)

※(日本語部分)はこちら(引用者)が要約して付け加えたもの。
※「bullshit」は「でたらめ」という意味

(↑尺度を作って実際にでたらめの感受度を測ってみた結果、一部予想に入ってない結果が出たものの、おおむね研究者の仮説と関連性があると考えられる)

 さすがにこの英文の引用文を理解できる人はごく一部なので、訳してみようと思います。(※だいぶ意訳です)
 「デタラメを信じやすい人は、考えが浅く、認知能力(例えば、言語能力・流動的知能(いわゆるアドリブ力)、数に対する認知能力など)が低く、存在そのものに対する錯乱や陰謀論的な観念を抱きやすく、宗教的・超常的な考えを抱きやすく、補完代替医療(いわゆるエセ医療)をおすすめしやすい。」
 まあ要するに、「いい加減なことを信じる人は考える能力に欠けてるし、いろいろ人生損してんじゃね?」てことです。

 また、Sara Hughes, Laura Machanが行った406人のイギリス人を対象にした研究で次のようなことを言っています。

Overall, we provide evidence to suggest that Covid-19 conspiracy beliefs mediated the negative relations between collective narcissism, Machiavellianism and both facets of psychopathy and willingness to obtain a Covid-19 vaccine. Covid-19 conspiracy beliefs also mediated the positive relations between collective narcissism, psychopathy and Machiavellianism and dissemination of Covid conspiracies. We have replicated recent findings in relation to collective narcissism and dissemination of Covid-19 conspiracy theories.

Sara Hughes, Laura Machan
It's a conspiracy: Covid-19 conspiracies link to psychopathy, Machiavellianism and collective narcissism (2020)

 要するに、新型コロナウイルスの陰謀論(ワクチンの陰謀)を信じている人に、または新型コロナウイルスの陰謀論を拡散している人に、自己愛(ナルシスト)、サイコパス、マキャベリズム(結果のためには手段を選ばないこと)の傾向が見られた、ということです。引用元の論文に相関係数の図表(Table)がありますので、より詳しく知りたい方はそちらを見ていただきたいです。
(※指摘が入るかもしれないので一応補足:原文ではワクチンの陰謀を信じている人ほど各パーソナリティが高かったという記述はないです。ワクチンの接種"意図"と各パーソナリティの相関を調べて負になったとの記載がありますが、本記事の主な読者層を考えてこのように言い換えておきました。)

 ではn回目の本題、行きましょう。

 一つ目の項目「TwitterやInstagram等のSNSより、YouTube等の動画配信サイトの方をよく見ている」についてですが、奇跡的(?)なことにすべての項目に相関がみられませんでした。あのTIPI-Jにおいても、です。
 これは聞き方が悪かったからなのでしょうか?何かの間違いかもしれないので、13-19歳のデータを散布図にしてみました。
 ※設問の都合上、横軸の1~5はTIPI-Jのものと反転しております。(要するに、横軸を反転してみてほしいということです。)
 ※相関係数は、横軸の1~5を反転して出した値を書いておりますので、そのままとらえていただければ大丈夫です。

相関係数r=0.03 p=0.786
(横軸が反転しております)

 うん、相関がないです。なぜなのでしょうか。
 念のため40代も散布図に落とし込んでみました。

r=-0.099 p=0.705
(横軸が反転しております)

 うーん…

1-12 r=-0.38 p=0.109 n=23
13-19 r=0.03 p=0.786 n=100
20-29 r=0.06 p=0.879 n=10
30-39 r=-0.44 p=0.556 n=6
40-49 r=-0.10 p=0.705 n=21
50-59 r=0.087 p=0.732 n=20
60-69 n=1
(横軸が反転しております)

 やけくそになってこんなものまで出してみました。30代が相関係数-0.44になっていますが、サンプルサイズ(調査数)が6で少ないのであまり参考にならないと思います。
 あと驚くべきことに、pが少ない値を取っている0-12歳において相関係数が有意に負の値を取っていました。これは本当にそのような傾向があるということなのでしょうか?それともこれは幼い子供ほど精神症的傾向が高くなるということなのでしょうか?(いわゆる大人の言う疑似相関というやつです)
 でも、これだと先行研究を再現できるようなものになってはいません。設問数の関係上、対照実験のようにきちんと一つ一つを対比させて聞けませんでしたのでそのツケが返ってきたのでしょうか?それとも、地域差があり、違う内容が返ってくるのは至極当然のことだったからでしょうか?
 ここらへんは総当たり法ではなく、もう少し具体的な研究が必要になってきそうです。
 ちなみに他の項目はどうなの?思った方もいらっしゃるかもしれませんが、全部きれいに相関がなかったのでうーん…という感じです。

(非正規分布だと仮定して、正規分布でよく使われるピアソンの相関係数はのほうではなく、ノンパラメトリック検定のうちの1つのスペアマンの相関係数で計算してみてもr=-0.05 p=0.554 でしたので多分そういう問題ではないかと思います…)

参考:なんとなくグラフにしてみたものの特に意味がなかったやつ
面白そうだったので一応載せておきました。
参考:10代に限定した時の項目の関係

 二つ目の項目に続きます。
『「新型コロナウイルス」に関する陰謀論を信じている』という質問項目なので、先行研究と同じく何らかの傾向がみられるんじゃないかなって期待していました。(実際に元論文のTable1の6番に当てはまります)

 そして、ちゃんと「サイコパス」「ナルシスト」「マキャベリズム」を判別できるような質問項目を入れておきました。(ちなみにこの3つの特徴はダークトライアドと言われています)

  • 自分の顔には自信がある。

  • 相手のことよりも自分のことに興味がある。

  • よく嘘をつく方だ

  • (自分の話や冗談が面白いと思う)

 そして、総当たり法で結果を求めた結果、なんと!
 新型コロナウイルスの陰謀論を信じている人ほど、休日の睡眠時間が短かったのです!!!
 
え?と思う方もいらっしゃるかもしれませんが、このような散布図になっているのです。

r=-0.30 p=0.000073
(繰り返しますが、横軸が反転しておりますので、反対にして見てください。
※相関係数は反転していない状態で出しております。)

一応分布も調べてみました。

新型コロナウイルスの陰謀論を信じている人の数を表したグラフ
(縦軸を反転して見てください。)

 これ、めっちゃ歪んでませんか?(そりゃ信じているのか信じていないのかわからない人(=3番)が多くいたらこの世の終わりですよね…)
 (Aセクションで若干触れましたが)自然に発生しうる事象のほとんどは「正規分布」だと言われています。

<再掲>正規分布のイメージ
By M. W. Toews - Own work, based (in concept) on figure by Jeremy Kemp, on 2005-02-09, CC BY 2.5, https://commons.wikimedia.org/w/index.php?curid=1903871

 きれいに山になっていますね。しかし、上の白黒の謎の点々があるグラフはどうでしょうか。真ん中に山が来ていませんね。これを「非正規分布」だと言います。
 実は、相関係数は主に二種類あって、山になっている「正規分布」の相関係数を求める場合は「ピアソンの相関係数」、やまになっていない「非正規分布」の相関係数を求める場合は「スペアマンの順位相関係数」を使うとよいと言われています。
 (さきほどの棒グラフで難しいことを書きましたが、要するにこのことです。ちなみにスペアマンの順位相関係数を求めるのはノンパラメトリック検定の1つであり、ノンパラメトリック検定とは、精度は低いもののどんなときにも使える(簡単に言えば自然に従っていない)、すなわち非正規分布の時にも使える検定だと思っておいてください。)
 (ピアソンの相関係数とスペアマンの順位相関係数の違いは特に知る必要はありませんが、とりあえずピアソンの相関係数においてはデータそのものの値を使って相関係数を出し、スペアマンの順位相関係数においてはデータの順番を整理して相関係数を出すものだと思ってください。)

 上の点々のグラフからして分かる通り、明らかに自然ではないのでスペアマンの相関係数(rs)も求めていきたいと思います。

rs=-0.29 ps=0.000167
(横軸が反転しております)

 はい、できました。相関係数は|0.3|を下回ったものの、0.3に近い値を保っており、かつp値が0に近いので有意な相関がみられると考えられます。

 ちなみに平日の睡眠時間のほうはr=-0.14 p=0.0793でした。またスペアマンの順位相関係数を用いてもrs=-0.13 p=0.0987でした。
 世界最大の睡眠研究(としばしばいわれるもの)(Conor J Wild, Emily S Nichols, Michael E Battista, Bobby Stojanoski, Adrian M Owen : Dissociable effects of self-reported daily sleep duration on high-level cognitive abilities (2018))によると、睡眠時間を(休日含め)一晩だけ増やすだけでも日頃の活動にバフをかけれるらしいので、休日にそう言った特徴がみられるのはおそらくこう言ったことが関連してきているのではないでしょうか。

 あれ、ところで先行研究のほうはどうなったの?と思う方もいらっしゃるかもしれませんが、すべて-0.3<r<0.3となってしまっていました。ただ、先行研究のほうだとr=0.3を中心に近い値になっていましたので、多少の誤差があったのではないかなと思っています。
 実際に「新型コロナウイルスの陰謀論を信じている」と「自分の顔に興味がある(←ナルシストの特徴の一つ)」に関してはr=0.23, p=0.00324となっておりましたので、(rs=0.17 ps=0.0233)やり方次第ではもっと有意な値が取れていたのではないかな~と思っています。

一応年齢別も出してみました。
年齢を0代に限定した結果  ・・・r=-0.02 p=0.945  rs=-0.16 ps=0.489
年齢を10代に限定した結果・・・r=0.37 p=0.00119 rs=0.29 ps=0.00633
年齢を40代に限定した結果・・・r=0.50 p=0.0281   rs=0.53 ps=0.0206
年齢を50代に限定した結果・・・r=0 p=1 (←たまたまです)rs=0.03 ps=0.89

 あれ!?ごめんなさい。先行研究の言う通り10代と40代において本当に相関が出てきてしまいました…(しかもpが低めの値を取っているので有意だと言える)
 これからいえることは、0代はおそらく質問の内容を理解していなかった、そして50代は偶然サンプルが悪かったということでしょうか。(r=0にこっちがびっくりしています)いずれにせよ、若年層において思ってた通りの結果が返ってきてうれしく思っております。
 結論:若年層において再現性が確認された!

(ちなみに他項目においても年齢別に相関係数を取ってみましたが、特に有意なものは見られませんでした。)

※第二次調査(ii)は新規テスト作成を目的としたものであるため、SNSの趣向やコロナウイルスに関する陰謀論の質問は設けてありません。ここからは第三次調査(iii)に直接バトンタッチとなります!

第三次調査(iii)

 第三次調査では、被験者の負担を考慮し、SNSと動画配信サイトの項目を除外してありますが、コロナウイルスに関する陰謀論とナルシストの関係についてはまだまだ調査していきます。
 まず「新型コロナウイルスに関する陰謀論を信じている」と「自分の顔に自信がある」の全年代での相関係数。こちらはr=0.09, p=0.0643となりました。
 ただ、非正規分布ですので、rs, psを求めてみると、rs=0.1, ps=0.0476となりました。
 年代が一番重要でしょう。年代別に相関係数を出してみると、このようになりました。

10代:n=255 r=0.08 p=0.212 rs=0.08 ps=0.184
20代:n=12 r=-0.35 p=0.268 rs=-0.37 ps=0.244
30代:n=10 r=-0.70 p=0.023 rs=-0.67 ps=0.035
40代:n=72 r=0.14 p=0.238 rs=0.15 ps=0.214
50代:n=41 r=0.48 p=0.002 rs=0.46 ps=0.003
60代:n=5 r=0.09 p=0.88 rs=0.10 ps=0.87

 rが無だったり負だったり正だったりで忙しい結果になりました。なんでなんだろうなと思い、サンプルサイズの問題かなと思いましたが、ここまでの相関係数となれば一つの理由で片付けられないでしょう。なんなら、30代と50代でそこそこ低いpの値が出てきているので、もしかしたらこの相関係数は正しい可能性が大いにあるかもしれません。
 もし正しいとしたら、どのような考察がたてられるのでしょうか?もしかしたら陰謀論者は新型コロナウイルスの陰謀を丸ごと忘れているのかもしれません。20代、30代はまだまだ若いので、陰謀論の癒着と離脱のサイクルが速いのかもしれません。そして40代, 50代は、一度身についたものがなかなか離れないので、去年のような傾向を維持していると考えられるかもしれません。特に50代においては、rが0.5程度、pが0に近いほうですので、誤差の可能性は少ないでしょう。10代に関しては、周りのSNSに影響されているよりかは、(影響されていれば20代30代も高くなるはず)親に影響されていると考えるほうが正しいかもしれません。

 以上より、陰謀論全般に関して新たに一つ仮説をたてようと思います。20代、30代の相関係数は結構な負の値をとってたことから、陰謀論者のコアは、おそらくナルシストとかダークトライアドでもない、ただなにかを言ってみたいだけの人、いわゆるただの思想家のようなものだと推測します。身近にいる人で例えるならば、おそらく政治家が一番近いでしょうか。
 そしてそのコアの外縁に潜んでいるのは、ナルシストやダークトライアドなどの不安症(または自己愛や自己冒信)でしょう。そういったような人が、不安等の症状から、わずか数人or十数人の情報に踊らされていると推測します。
 次にそのようなナルシストやダークトライアドは、やがて一般人を侵食していくでしょう。ほとんどのケースは一般人で止められますが、(←Twitterのコミュニティノートみたいな機能)どうしても親による子どもの侵食、友だちによる知り合いの侵食等々、様々な犠牲が出てきてしまいます。
 (もちろん陰謀論自体悪いとは言いませんし、科学自体良いということを言おうと思っていません。ただ、現在の社会においては科学がメジャーであり、マイナーな陰謀論はしばしばはぶかれる傾向があります。このような世の中で陰謀論を信じるということは、何かしらよっぽどの理由がない限りおすすめいたしません。)
 話が少々ずれてしまいましたが、このような考察を参考にすると、もしかしたら来年にはこの値も少し変わってくるのかもしれません。UFOに関する陰謀論も入れれば、もしかしたら外向性や精神症的傾向などとの関係性が取れるかもしれません。(もしかしたらの話ですが・・・)
 なにがともあれ、深堀りすると面白そうな話題でした。
 第四次調査に持ち込み決定です。

 ちなみに第一次調査(i)では、休日の睡眠時間と陰謀論を信じることの間に負の相関が見られましたが、今回はどうでしょうか。

全年代:n=395 r=0.02 p=0.68 rs=0.01 ps=0.77 
10代:n=255 r=0.00 p=0.955 rs=-0.03 ps=0.68
20代:n=12 r=-0.49 p=0.106 rs=-0.52 ps=0.08
30代:n=10 r=-0.41 p=0.238 rs=-0.23 ps=0.524
40代:n=72 r=-0.05 p=0.66 rs=-0.01 ps=0.913
50代:n=41 r=0.11 p=0.485 rs=0.22 ps=0.18
60代:n=5 r=0.41 p=0.49 rs=0.29 ps=0.64
※年代を答えていない人は除外した。

 主に20代、30代において負の相関が見られましたが、前回見られたはずの10代、40代、50代に関しては跡形もなく消え去っています。20代のp値が一番低いですが、検定のしすぎでまぐれの可能性もあるので、有意かと言えばうーん…という感じです。
 しかしなぜ上下含めて20代と30代だけが負の相関を取っているのか、私にはよくわかりません。もしかしたら、たまたまそういう集団だったからなのかもしれません。もしかしたら、先程言ったようにコロナウイルスの陰謀論を信じている層が変わってきているからかもしれません。もしそうであれば、来年はどうなっているのでしょうか。(iv)に期待です。

E 好きなものと他項目の関係

好きな教科とTIPI-Jの各項目の関係

時間の平均値(標準偏差)

 性別等々とは異なり、好きな教科における各項目の点数が大きく異なっていたので、ここからは好きな教科に関して取り上げていこうと思います。
 役に立つかどうかはわかりませんが、どの教科がどこの項目で高い点数がとっているのかを表にしてみました。
 英語はどの項目においても比較的低い点数がみられ、反対に理科は勤勉性以外において比較的高い点数がみられるようです。
 ただ、これに関しては誤差の可能性もあるかもしれないので追加の検証が必要となってくるでしょう。

好きな教科とスマホ利用時間と睡眠時間の関係

時間の平均値(標準偏差)

 p値が高いものの、こちらの表では各科目におけるそれぞれの時間についてまとめてみました。全体としては理科や社会のスマホ利用時間が高い傾向にあるようです。理由に関しては考察の余地があると思いますが、上の方のTIPI-Jの表を見て分かる通り、理科や社会(英語含む)の勤勉性が低くくなっております。中学・高校課程における理科社会の習得が他教科に比べて簡単だからなのでしょうか?また、理科社会においては、ネット上に大量の教材がおちていると推測することができます。特にニュースやSNSで政治や時事情報等の無意識的な入手がしやすいです。最近ゆっくり実況で「○○なのはなぜか?」みたいな動画が多く出回っておりますので、恐らくそういった部分も関係してくるでしょう。

参考:各科目を選んだ人の人数と年齢の関係
実は国語と数学が好きな人は相手と知り合った年数が他の教科が好きな人より長いことが裏で判明していましたが(平均+25%~35%程度)、それについてはこの表↑を見れば理由がわかります。
(↑年齢が高い人ほど国語・数学が好きであるため)

好きな音楽ジャンルとTIPI-Jの関係

各音楽ジャンルを選んだ人とTIPI-Jの関係{平均値(標準偏差)}
※n=2以下のデータは省いている。
なお、音楽ジャンルについて問いている問題だが、曲名を書いたものは各音楽ジャンルに変換し、複数書いているものは一番最初に書いたものをこの表に当てはめた。
また、表記が複数あるもの(例:j-pop, jpop, JPOP)は一つにまとめた

 サンプルサイズが少ないものもありますが、各音楽ジャンルにおいて有意な差があると言えるでしょう。
 例えばボカロでしょうか。ボカロの各TIPI-Jの項目において、精神症的傾向が比較的高いことがうかがえます。また、jpopにおいては協調性が高いということもわかります。
 2010年(2008年ともいわれる)に公表された、ヘリオット・ワット大学のAdrian North教授が音楽ジャンルと人の性格について調べた論文BBCにも取り上げられています)をはじめとした、数々のレポートや研究がこのようなものについて調べていますので、良ければネットとかで調べてみてください。

参考:各音楽ジャンルを選んだ人の人数と年齢の関係
特にボカロにおいての年齢の差が顕著に出ている。


好きなゲームジャンルとTIPI-Jの関係

各ゲームジャンルを選んだ人とTIPI-Jの関係
n=2以下のデータは省いている
なお、回答としてゲーム名を書いたものは各ゲームジャンルに変換し、複数書いてあるものは一番最初に書いたものをこの表に当てはめた。
また、表記が複数あるもの(例:マイクラ、マインクラフト)は一つにまとめた

 同じくサンプルサイズが少ないものもありますが、こちらも有意な差がみられました。例えば、調査数が少ないもののオープンワールド、シミュレーションのように自分の世界に入り込めるものでは外向性が低くなっていました。(音ゲーも同様な傾向が見られます)また、FPSにおいては外向性が高くなっていました。さらに、RPGやパズルにおいては協調性がかなり高く、(RPGに関してはおそらくソシャゲの影響があると思います)パズルは勤勉性においても高い傾向が見られました。アクションゲーム、シューティング、音ゲーにおいては精神症的傾向が高く見られました。アクションゲームにおいては開放性が高く見られます。

 ゲームジャンルとTIPI-J(性格診断や尺度によく使われるBIG5を10項目にまとめて日本語化したもの)の関連性を調べた研究は調べてもそうそう見つからなかったので、ここで調査してみようと思ったのがこの結果です。
 私事ですが、私もゲーマーの1人であると信じていますので、この結果は絶対に一生忘れることはないと思います。このような結果がとれてうれしく思います。

 ちなみに偶然ではないの?と思った方もいるかもしれませんが、はっきり言って私はあると思います。でも安心してください。まだここで研究が終わったとは一言も言ってないですよ。

F 金と人間の関係

第二次調査(ii)

 人は金で変わります。なんてひどいことでしょう。金と愛どっちが大事?と質問されたら約半数の人は金と答えます。"金"ほど"愛"されているものはないでしょう。
 金と人の心は密接な関係にあります。なぜなら金は労働(=人生の時間)の代償だからです。どちらも人生の1パートであることは変わりないということです。
 ケンタッキーがV字回復したように、こちらも何か真似してみたいと思い、お金に関しての項目を入れてみました。

※表記のない者はすべて平均値
第一、第三四分位数を超えた値は赤色で表示してある。
(※外れ値自体は第一四分位数-四分位範囲×1.5以下or第三四分位数+四分位範囲×1.5以上と定められることが多いが、今回は厳密に見る必要がないため割愛)
2番:物事の順序はとても大事だ。
15番:周りの人を楽しませるのが好きだ。
(17番:自分の中で満足するだけではなく、他人から評価されるような人になりたい)
18番:しんどいことをそのまま一人で抱え込んでしまうタイプだ。
20番:礼儀正しいタイプだ。

 一部サンプルサイズが小さいものもありますが、それを除けば基本的に17番が大暴れしていることがよくわかります。メニューと表記のあるものは松竹梅の法則を拡張したものとなっております。正直言って選択肢はどうやってもピンと来なかったので、この結果を見ても個人的に微妙だな~と思ってます。こちらに関しては、自分を優先している人が無難な選択肢を選んでいる、外向性が高い人は高い値段を選びやすいなど(きれいに単調増加している)いろんな考察ができますので興味のある方は上の画像からいろいろ考えてみてほしいです。とはいえ、問題が問題ですのでこちらに関しては(iii)で改めて検証しておこうと考えました。

(松竹梅の法則は、簡単に言えば3つの選択肢が与えられたとき人間は真ん中を選ぶ傾向があるといういたってシンプルな法則ですが、今回はn(調査数)の数を見る限り少々値段設定がずれてしまったかもしれません。元は大人を対象にして作ってるので、ちょっと感覚のずれが出てきてしまったのでしょう。)

 個人的に作ってて一番面白かった質問がお金持ちから金を奪うかどうかの質問でしたが、さすがにそこまで異常値が見られるといったことはなかったようです。残念(?)

 今回の調査はあくまでも"事前"のもので、例えるならば中華料理屋でよく出される前菜みたいなものです。今のが2辛カレーだとすると、次は18辛くらいあるでしょうか。詳細は省きますが、次の(iii)の調査が本番ですので、ぜひ続けて見てください。

G 人間はAIの書いた文章を見分けられるか?

第二次調査(ii)

 実際に出されたAIについて判別する問題です。
 一つがみなさんが見るようなwikipediaを参考に作った文章、もう一つがChatGPTにいろんな指示を出して作ってもらった文章です。果たしてどっちが人間の作ったものか、わかりますか?

人類学は他の学問のもとに立っています。人類学は対象を人類に定めている以外には、特に他の条件を持っていません。そのため、その内容は遺伝子解析から、科学的な手法を使った心理的な研究まで様々です。

人類学は、文化や社会を研究する学問です。異なる地域や時代の人々を比較し、人間の進化、言語、習慣、信念などについて深く理解することを目指します。異文化理解や社会問題の解決に役立つ学問です。

 ↓

 答えは・・・

 一番目です。

 一番目は、人間が書いたものですがこちらでですます調にしています。これはAIと大差をつけないようにするための調整です。
 二番目については、結構詳細に書かれていますね。実はこれ、AIをうまく使った結果なのです。AIに文章を書いてもらい、そこからAIに要約等の添削をしてもらいました。
 こちらがChatGPTに一番最初に出してもらった文章です。

 人類学は、人間の文化や社会を研究する学問です。人類学者は、異なる地域や時代の社会集団や文化を比較し、人間の進化、言語、習慣、信念などについて理解しようとします。文化人類学、考古学、生物人類学、言語人類学などの分野があります。人類学は異文化理解や社会問題の解決にも役立ちます。

 同じ主語が出てきたり、ですます調が結構目立ってたりと、AIらしい文章が出てきましたね。(英語から翻訳して書いた結果なのかもしれませんが)
 真ん中に「~について理解しようとします」という日本語がおかしい文章があります。このあと要約するように頼んだ結果がこちらです。

 人類学は、文化や社会を研究する学問です。異なる地域や時代の人々を比較し、人間の進化や言語、習慣、信念などについて理解しようとします。異文化理解や社会問題の解決に役立ちます。

 いい感じになりましたが、ちょっと物足りないですね。文字数的に人間の書いたものとほぼちょうどにしたいので、「わずかに長くして!」と頼んでみました。そしてその結果が上に挙げたものです。(下画像参考)

 完璧です。ここで正答率についても見ていきましょう。

人間が作ったものについて


AIが作ったものについて

 人類、敗北。
 これ、AIが作ったものを人間がちょっと調整すればほぼバレないんじゃないのかな?という気がしてきます。実際にAIかどうかを判別できるサイトにこの文章を打ち込んでみましたが、全くもってAIかどうかを判別することはできませんでした。恐ろしすぎる…

H 総当たり法の成果は?(その他)

 総当たり法の結果について一つ一つ紹介してしまうと文字数が8万字とかに達しそうなので、ここからは主なものを紹介していきます。(相関を取ってみただけでも合計で80個以上の結果が得られました)

実際の当たり屋の現場
(すべて相関係数です。スプレッドシートで出しました)

 解説の前に、有識者から反論が来そうなので総当たり法の統計上の欠点を紹介しておきます。(※ここでいう総当たり法はステップワイズ法のことではありません)
 それはずばり、たまたま相関がでてきた結果をあたかも本当のように扱ってしまうというものです。
 さきほど新型コロナウイルスの陰謀論を信じている人ほど休日の睡眠時間が短かったとお話ししましたが、まさにそういったデータがたまたまでてきてしまうからだそうです。(もちろん本当に相関があるからかもしれませんが…)
 しかし、個人的には総当たり法で出た結果は因果関係が取れそうな場合に後で追加検証すればいいだけですし、何も結果が得られないよりはましだと考え、そもそも他の人と差別化をするために行った手法なのでこの場において特に問題はないと考えております。

 では、本題に行きましょう。

相手に対する考え(感情)はあまり細分化されていない

 よく恋は人を盲目にすると言いますよね。それだけではなく、普通に友情とかも人を盲目にするのではのではないかということです。(伝わってるかな…)
 実際に「相手は思いやりのある人だと思う」という項目は「外交的な人だと思う」(r=0.37 p=0.000000953)、「真面目でコツコツ努力する人だと思う」(r=0.43 p=0.0000000083)、「自分と気持ちや性格があっていると思う」(r=0.35 p=0.00000533)、「相手の話や冗談が笑えると思う」(r=0.30 p=0.0000724)、「その人と会話するとストレスが吹き飛ぶ気がする」(r=0.36 p=0.00000227)、「理由のないことを押し付けると思う」(r=-0.47 p<0.001)等の項目と有意に相関していました。
 また、それぞれの項目がそれぞれの項目と相関しているので、誤差という可能性は比較的低いと思います。また、質問によっては大きい負の相関がみられたので適当に選んでいった可能性は低いと考えられます。
 以上のことを踏まえると、相手に対しての感情や考え方は大まかなものであるのかもしれません。しかも、相手に対する質問の項目は質問数が23で相関関係が39個見られたのに対し、自分に関する質問は質問数が20で相関関係が10しか見られませんでした。質問の内容によるものなのかもしれませんが、一応ところどころ相手に関する質問と同じようなものを選んで自分に関する質問の項目に入れているようにしていますので、ここまで明らかに違うということはおそらく何らかの理由があると考えられるでしょう。

相手と付き合った年数が長い人ほど、相手と口論になったことがある

 半分当たり前のことですが、逆に言えばこれは口論の多さは付き合った年数の多さに相関があるということにもなるのではないでしょうか。間に直接的な因果関係は多分ないと思いますが、相手との口論を恐れすぎてはいけないのは一般的に言われている通り確かなことでしょう。(r=0.43 p=0.00000000664)

おまけ 血液型と性格の関係

第二次調査(ii)

 実は今回のテストでは、血液型と他項目の関係について見てみようと思い、血液型を入力する欄を設けておきました。血液型診断は科学的根拠の薄いものですが、実際に自分の目で確認してみよう!と思い、それを問うような質問を設けておきました。

血液型別に見た平均と全体においての平均
(真ん中の質問1~23は1~5の範囲内での選択)
第一四分位数、第三四分位数を超えたものについては赤で表示してある。
※↑一般的に言われる外れ値は
第一四分位数-四分位範囲×1.5以下 or 第三四分位数+四分位範囲×1.5以上に注意

 17番の質問「自分の中で満足するだけではなく、他人から評価されるような人になりたい」において異常値とみられる結果が見受けられます。また、TIPI-Jの勤勉性においての項目も異常値に近い数字が出ております。
 ただ、これだけだと誤差かもしれないので、今回は結論付けずに後回しにしようと思います。(iii)にて再検証しようと思います。

 実はこの17番の質問、何が狂ったのか他のところでも異常値を示しております。

 表示された文章がAIが作ったものかどうかを判断させる問題が2問ありますが、なぜか「自信あり」と答えた人のほうが17番の数値が低くなっています。自分の中で満足したい人は、やはりそれくらい自分について自信を持っているからでしょうか。そうすれば下のほうの「自分にとって最も大切なものは何か」の「個人の成長や自己啓発」の数値が低くなるのも納得です。ちなみに総数はすべて15を超えているので、調査数が少なすぎてこういう値になってしまったということはおそらくないんじゃないかなと思っています。いづれにせよ、再検証したほうが確実でしょう。(iii)にてまた取り上げます。

第三次調査(ii)

 何かの偶然だと思い、第三次調査でまた調査してみました。結果はこちらです。

 外れ値どころか、第一、第三四分位数を超えているものはほとんどありませんでした。(iii)は、サンプルが数百にものぼるため、信憑性が(ii)よりはるかに増します。つまり、(ii)の結果は偶然だった可能性が高いということです。
 ちなみに、今回のテストでは数字で答える以外の質問も設けてあります。例えばこちら。
 
 あなたはダイエットを始めることにしました。自宅にはお菓子があるが、我慢して食べないようにしますか?

・我慢して食べないようにする
・我慢しても食べてしまう
・そもそも我慢しない

 我々の思うA型は几帳面ですので、おそらく我慢して食べないようにする傾向があるでしょう。B型は真逆ですので、我慢しても食べてしまうorそもそも我慢しないを選ぶと思われます。

(素材のたまり場)

 一方で、心理学が好きな人はこの世の中にたくさんいます。ユーチューブで「悪用厳禁!明日から使える心理学5選!」を見かけるくらいですから、やはりそれくらい(実用性のある)心理学が人気なことは間違いないでしょう。しかし、なぜかみんな自分の気になったことを検証しようとしてみません。「あの子、うちのこと好きかな、、」と"本気"で気になっているのであれば、ネットにある占いを信じるよりかは、きちんと自分でサンプルを取って、検証していけばいいはずです。なのにみんなやりません。つらい"現実"を見たくないからでしょうか。

例えばしぐさの多い女性。このような女性はしばしばかわいいと思われがちではあるものの、意外と裏の一面があるのかもしれない・・・などなどいろいろなことを教室の中で考えていました。

 さて、ここまで2万5千字とかなり長くなってしまいましたが、初回の約2万5千字の記事を授業のある3日間で書きあげた私にとってはまだまだ通常運転です。むしろまだ折り返し地点にすら到着していません。読者の皆さん、覚悟してください。

(i)倫理上の問題について

 有識者の皆さんはここまで話してきて何か思うことがあるかもしれません。まだ高校生ですので、統計上の問題があれば温かい目で見てもらえば幸いですが、(良ければコメントでお知らせください)倫理上の問題はどうなの?と思った方もいるかもしれません。
 本研究はスクールカウンセラーと相談をしながら進めており、質問内容は相手の傷に干渉(専門用語でいうと侵襲)をしないように配慮をして作成しております。また、机上にはマニュアルをつけており、質問紙にも回答した内容は本研究に使われるということを明記しております。また文化祭という関係上、0代のお子様だと親と同伴しておりますので、できる限り親にそのようなことを説明して、かつマニュアルにてその旨を記載しておりました。
 心理テストは、IQ診断のような良し悪しのあるものではなく、あえて性格の一面をぼんやりとらえられて、かつネット上でネガティブな印象を与えるようなサイトが限りなく少ないという特徴を持つ、テストのうちの1つであるエゴグラムを採用しました。結果用紙は上に貼り付けたように、ポジティブな印象を与えられる結果を主に書いております。また、個別的なアドバイスはコントロールが難しいので、点数だけ書いて渡すようにしました。TIPI-Jのようなものの結果は渡しておりません。
 10代の未成年も当テストにやってきますが、当学校の生徒は厳しい選抜が行われること、また質問紙が無記名であるという関係上、そして質問内容が心的外傷後に触れないもので、かつ回答の内容が他人に見られないという配慮の元であったため、倫理上大きな問題はないと考えて研究を進めました。

 なお、所定の倫理審査を受けようかと思いましたが、予算が圧倒的に足りなかったため断念いたしました。スクールカウンセラーの簡易的な審査(倫理審査委員会ではない)しか受けていないため、万が一学会に発表にするときは、0代及び10代のデータを省いた結果を出す予定です。

加えて、結果部分の最初の方にて取り扱う専門用語を再掲しております。困ったときにご活用ください!

 もちろん陰謀論自体は悪いものとは言いませんし、そもそも科学自体陰謀論のようなものの一種です。科学も陰謀論も、人間が作ったものですので正確性を100.0%保証しているとは限りません。ただ、どちらが人間の思うより厳密なものなのかという点において違うだけなのです。
 しかし、どちらが真実なのかという保証はないため、どちらか一方のみの、自分にとって都合の良い主張を採用するのは本末転倒だと私は考えます。陰謀論者は科学について知る必要がありますし、逆も然りです。例えるとするならば、昔の天動説と地動説のようなものでしょうか。お互いに、それぞれの正当性を比較し、どちらがより正確で厳密なのかを決めるべきだと思います。もし科学が正当的なのであれば、その分の根拠を持って陰謀論者に向かうべきでしょう。(そもそも陰謀論者に科学を理解できる力があるのか怪しい場合も多いですが…)

この記事が気に入ったらサポートをしてみませんか?