エムオーテックス株式会社が運営するテックブログです。

JDLA Generative AI Test への挑戦と効果的な学習方法を探る

JDLA Generative AI Test への挑戦と効果的な学習方法を探る

はじめに

こんにちは、サービス戦略課の宮崎です。

生成AI という言葉が世を賑わしてから、幾年も経たない中で太陽が一番高く上る夏至の頃。

ドキドキしながら CBTS の受験者マイページにログインしたら 合格 の文字がありました。

今回は 一般社団法人日本ディープラーニング協会(JDLA) が主催している Generative AI Test を受験してきたので、他の AI 系の試験にも役立ちそうな学習方法をご紹介します。

www.jdla.org

なぜ受けたのか?

受験費用2200円なので手軽に受けられます。受験資格は要らないので気軽に受けられます。IBT試験なので家でも簡単に受けられます。

そして何よりも 生成 AI に特化した試験 だったからです。AI って聞けば生成 AI を指すくらい世界中で盛り上がってますからね。

ただ、実は私は ディープラーニングG検定 を取得していますが、ChatGPT が登場する前の試験(それでも数年前なんですが)だったことから、生成AIという単語は聞き慣れません。

生成 AI が世界中で盛り上がっている中、取り残されまいと 知識をアップデート する必要があったのです。

合格基準

実は試験を受けた後に気づいたのですが、合格基準は非公表 でした。

感覚としては8割くらい取れたイメージで、結果も実際そのくらいの点数でした。

設問は全20問あり、そのうち19問が選択問題、最後の1問が記述問題となっています。過去問が公開されていますので、ぜひ参考にしてみてください。

www.jdla.org

生成 AIとは何か?

AI とは何か?という話をする際、一つの回答として 機械学習の手法を使った学習推論 が近年のAIのトレンドだという話ができます。実際、多くの書籍には 第三次 AI ブーム という言葉が見てとれます。

ディープラーニング(深層学習)の手法を使えば、大量のデータをいくつかの学習方法(教師なし学習や教師あり学習)でAIモデルを訓練し、学習させた AI モデルを元に新規のパラメータを投影して推論することができます。

ディープラーニングは人間の脳神経回路であるニューロンを模して作られたニューラルネットワークを多層化しているもので、学習を進めれば赤ちゃんが成長するように賢くなり、偏ったパラメータで学習をさせれば人間が偏見を持つように偏った回答をするようになります。

この手法は早くから発見されていましたが、近年のコンピュータの発達に加え、精度の良さから更に派生的な手法が多く生まれました。


ここまでは機械学習を勉強する上での導入部分に過ぎません。そんな時、2022年に彗星のように現れた AI が ChatGPT です。生成 AI(Generative AI) という単語はここから急激に普及しました。

ChatGPT 以前以後と後世に語り継がれる程の時代の転換点だと思いますが、その技術自体はあくまで機械学習に基づく手法の一形態に過ぎませんでした。

さて、生成AI とは何か?という話をする際、つい LLM や画像生成のことだと考えてしまいますが、AI に明確な定義がないのだから、生成AI もやはりトレンドになります。あくまで 第三次 AI ブーム の範疇ですが、その影響力は計り知れません。

学習方法その1 -シラバスを読む-

大抵の試験にはシラバスがあります。有難い事に Generative AI Test はトップページにシラバスが載っているので、単語を検索すれば大体の内容は把握できます。

www.jdla.org

目を皿のようにして全部学習するのも辛いので、初めて聞く言葉やよく理解してない言葉を起点に調べ物をして、その周辺知識を更に勉強して埋めていく方法を取りました。技術と利活用の範囲は広いので、特にヤマをはる必要はないと思います。

言明はできないのですが、生成 AI だからこそ起こる事象については、出題されることに確信があったので、自分が覚えている内容に相違がないか確認する目的で勉強しました。

このように今回は知識を補うような勉強方法を取ったので、今まで勉強した内容にプラスアルファできて丁度良い試験でした。

学習方法その2 -生成 AI の前に機械学習から勉強する-

生成 AI はその名の通り生成に関連する技術なので、推論にフォーカスした技術と捉えることもできますが、学習も必要なので推論だけで成り立ってはいません。

推論とは何か?学習とは何か?という話になると、ディープラーニングとは何か?ニューラルネットワークとは何か?という地点にまで戻ってきます。

自己流ですが、私は AI のことを 反応、生成 AI のことを 出力 と捉えて分野分けしています。

生成 AI に特化した試験ではありますが、AI と明確に分けることが出来ないため、機械学習の勉強から始めていくのが一番の近道なんだろうと思います。


その点について、公開されている過去問から考えてみましょう。

(https://www.jdla.org/certificate/generativeai/issues/)から引用

選択肢 A は です。スケーリング則とパラメータ数が紐づくか?という知識がないと答えられませんが、シラバスに載っている情報なので、この問題はシラバスの読み込みが鍵になります。

選択肢 B は × です。これもスケーリング則の知識がないと答えられませんが、選択肢としてAとは真逆だということが分かります。生成 AI に興味があれば性能競争やパラメータ競争はしばしば話題に上るので、技術動向を考えれば×だろうと推測はできます。

選択肢 C は × です。文字情報をプロンプトとして入力とする場合もあれば、PDFのようなファイルを画像データとして入力とする場合もあり、様々な使い方があります。

選択肢 D はどうでしょうか?肌感で何となく分かると思いますが、実はこの設問にある 強化学習 はシラバスに載っていません。

機械学習の学習手法で代表的なものとして 「教師あり学習」「教師なし学習」「強化学習」 があります(他にもたくさんあります)が、シラバスを見ると 「教師あり学習」「自己教師あり学習」「事前学習」「ファインチューニング」 とあります。

これらは生成 AI の学習における中核技術であると考えられますが、多くの生成 AI が機械学習の手法を用いて作られている以上、シラバスに載っていなくても知っておくべき知識となります。


選択肢 D は でした。このような引っ掛けになりそうな問題には注意が必要です。

学習方法その3 -ニュースを見る-

皆さんニュース見てますか?

先日、新聞に載っていたニュースでは、生成 AI の特許出願件数が、中国、米国、韓国、日本の順で発表されていました。

jp.reuters.com

特許出願も生成 AI が中心になってきてますね。上記の国を注視すれば、技術動向についてトレンドを押さえられるでしょう。


しかしそれだけでは足りません。

世界中で AI の脅威が叫ばれており、AI を作る人も使う人も、道徳と倫理感と責任感を持つ必要があります。

そのため、Generative AI Test に限らず AI 関連の試験は 動向 というのが当たり前のように出題されます。

例えば、上記で挙げた特許の動きは注目すべきです。英国では AI による発明品は特許として認めないというのが現在の司法判断になります。 jp.reuters.com

その一方で、米国では運用で幅を持たせようとしています。法律で追いつかない苦労の影が見えますね。 jp.reuters.com

私も日本在住なので感覚として捉えにくいところはありますが、AI に限らずテクノロジーは海外情勢に左右されることが少なからず存在します。

日本の法規がどうなるかは、日本在住の方が一番早く情報を押さえられるため、普段からニュースにアンテナを張ることが大切です。

おわりに

シラバスの中に「自己教師あり学習」がありましたが、G検定の勉強をしていた頃は、「半教師あり学習」というものがありました。

前者がラベルなしのデータ、後者が少量のラベルありとラベルなしのデータで学習します。似たような概念ですが、生成 AI で利用される自己教師あり学習は莫大なパラメータを用いて精度を上げる中核技術になります。古い知識のままなら、半教師あり学習と混同していたことでしょう。


試験を受けるという意識ではなく、知識のアップデート をモチベーションとして、皆さんも取り組んでみては如何でしょうか?

次回の試験は 2024年12月7日(土) に実施されます。