Skip to content

Commit

Permalink
fix: erukiti
Browse files Browse the repository at this point in the history
  • Loading branch information
erukiti committed Dec 9, 2024
1 parent 2580c04 commit 972c04e
Show file tree
Hide file tree
Showing 2 changed files with 23 additions and 21 deletions.
28 changes: 15 additions & 13 deletions src/chap-erukiti1.re
Original file line number Diff line number Diff line change
@@ -1,24 +1,24 @@
= 学ぶ・学びと言語化
= 学びと言語化

//flushright{
@erukiti
//}

「学ぶ」とは何だろうか?「まねぶ」が語源だとか、知識を得る行為だとか、辞書に書いてある事はさておき、学ぶとは本質的には自己変容だ。少し大げさな言い方に聞こえるかもしれないが、我々は物事を知らない状態から、学習を通じて、理解する状態へと変化していく。
「学ぶ」とは何だろうか?「まねぶ」が語源だの、知識を得る行為といった辞書に書いてある事はさておき、学ぶとは本質的には自己変容だ。少し大げさな言い方に聞こえるかもしれないが、我々は物事を知らない状態から、学習を通じて、理解する状態へと変化していく。

「学び」とは何だろうか?「学ぶ」は動詞で「学び」なら名詞だ。学びは、学んで得た知識や経験、そしてその獲得過程全体を指す。

学びには二つの形態がある。一つは経験や直感として個人の内部に留まる「暗黙知」だ。自転車の乗り方のように、言葉で説明するのが難しい知識だ。もう一つは、言葉や図表で表現された「形式知」だ。教科書やマニュアルのように、誰でも共有できる形に整理された知識だ。学びは多くの場合、暗黙知として始まり、言語化を経て形式知となる。それによって自分の理解が深まり、他者とも共有できるようになる。これこそが、皆さんが目にする一般的な学びの形だ。
「学び」とは何だろうか?学びは、学んで得た知識や経験、そしてその獲得過程全体を指す。学びには二つの形態がある。一つは経験や直感として個人の内部に留まる「暗黙知」だ。自転車の乗り方のように、言葉で説明するのが難しい知識だ。もう一つは、言葉や図表で表現された「形式知」だ。教科書やマニュアルのように、誰でも共有できる形に整理された知識だ。学びは暗黙知として始まり、言語化を経て形式知となる。それによって自分の理解が深まり、他者とも共有できるようになる。これこそが、皆さんが目にする一般的な学びの形だ。

現代は大量の情報が流通していて、その中に多くの言語化された学びがある。ブログや本、同人誌は、それらの典型的な形だ。学びを読者に伝えるための物だ。今この本を手に取っている読者は、まさに言語化された学びを読んでいて、ここから何かを学んで自己変容を遂げようとしている。あるいはもう既に自己変容した後だろうか。

この奥深い学びの本質に迫るために、まず避けて通れないのが「言語化」という要素だ。なぜなら、言語化は学びを深め、定着させ、共有可能にする核心的なプロセスだからだ。これから数章にかけて、筆者なりの考察をお伝えしていきたい。
この奥深い学びの本質に迫るために、まず避けて通れないのが「言語化」という要素だ。なぜなら、言語化は学びを深め、定着させ、共有可能にする核心的なプロセスだからだ。

これから数章にかけて、筆者なりの学びについての考察をお伝えしていきたい。

それでは、この学びにおいて最も重要な言語化について、具体的に掘り下げていこう。

== 言語化とは何か

言語化について、まずはシンプルな学習のプロセスから見ていこう
言語化について、まずはシンプルな座学のケースをもとに学びのプロセスを考えよう

我々は何かを学ぶときに、まず情報をインプットする。これは読書かもしれないし、ウェブ検索で見つけたページや、講義の受講かもしれない。他者が言語化したそれを読むなり、聞くなりする。

Expand All @@ -30,17 +30,17 @@

言語化とは、単なる言葉への置き換えではない。我々は日常的に言語を用いて思考しているが、それと意識的な言語化には本質的な違いがある。その違いは主に三つの点に現れる。

第一に、構造化の度合いが挙げられる。我々の日常的な思考では、言語だけでなく、イメージや感覚、直感的な理解など、様々な要素が未整理のまま混在している。「なんとなくそう思う」「どことなく良い感じがする」といった曖昧な認識が大半を占め、それらの要素間の論理的な関係性も曖昧なままとなっている
第一に、構造化の度合いが挙げられる。我々の日常的な思考では、言語だけでなく、イメージや感覚、直感的な理解など、様々な要素が未整理のまま混在している。「なんとなくそう思う」「どことなく良い感じがする」といった曖昧な認識が大半を占め、それらの論理的な関係性も曖昧なままとなっている

第二に、意識的な分析の有無だ。日常的な言語使用が無意識的・自動的なのに対し、言語化は意図的な分析のプロセスを必要とする。例えば「なんとなく良い」と感じている商品があったとする。これを言語化する際には、その感覚の背景にある要素を一つ一つ検討し、「価格が3000円と手頃で、デザインが主張しすぎず落ち着いており、必要な機能が過不足なく揃っている」といった具体的な要因に分解していく。

第三に、検証可能性の違いがある。漠然とした印象は主観的で検証が難しいが、言語化された内容は他者による確認や批判が可能だ。「コストパフォーマンスが優れている」という結論も、具体的な根拠があってこそ意味を持つ。
第三に、検証可能性の違いがある。漠然とした印象は主観的で検証が難しいが、言語化された内容は他者による確認や批判が可能だ。「コストパフォーマンスが優れている」という結論も、具体的な根拠があってこそ意味を持つ。現代であればこの他者はChatGPTで検証できる。

このように言語化とは、漠然とした思考を、意識的に整理・構造化し、他者と共有可能な形に表現するプロセスだ。

== 言語化の重要性:プログラミングの例から

プログラミングの世界では、半年先の自分は別人だと思えという格言がある。これは言語化の重要性を端的に示す例だ。
プログラミングの世界には、半年後の自分は別人だと思えという格言がある。半年後の自分は文脈を忘れた状態で、自分が書いたソースコードを、まるで他人が書いたもののように読むことが多いからだ。これは言語化の重要性を端的に示す例だ。

プログラミングとはソースコードを書いて、それをプログラムとして動かすものだ。ソースコードはコンピュータ専用の特殊な言語であって、人間にとってわかりやすい言葉ではない。ソースコードは、難解な指示書のようなものだ。

Expand Down Expand Up @@ -133,7 +133,7 @@

note@<fn>{erukiti-note}はバズりやすく活発なので、慣れてきたら力試しができる。ソフトウェア技術者ならQiita@<fn>{erukiti-qiita}やZenn@<fn>{erukiti-zenn}も良いだろう。

学びという題材からは少しだけズレるかもしれないが、小説のような形であれば、小説家になろう@<fn>{erukiti-narou}・カクヨム@<fn>{erukiti-kakuyomu}がいいだろう。学びを小説というかたちで、伝えることもできるかもしれない。人類は物語を介して様々な学びを伝えてきた歴史を持っている。
学びという題材からは少しだけズレるかもしれないが、小説のような形であれば、小説家になろう@<fn>{erukiti-narou}・カクヨム@<fn>{erukiti-kakuyomu}がいいだろう。学びを小説というかたちで伝えられるかもしれない。人類は物語を介して様々な学びを伝えてきた歴史を持っている。

//footnote[erukiti-sizu][https://sizu.me/]
//footnote[erukiti-note][https://note.com/]
Expand All @@ -159,9 +159,11 @@ note@<fn>{erukiti-note}はバズりやすく活発なので、慣れてきたら

こういった目的にはSNSもありだ。Twitterは元々マイクロブログと呼ばれていた。最初は140文字に限定されたブログだったのだ。

あなたが何かしらのエンタメが好きなら、そのエンタメの感想や考察をつぶやいてみるといい。このときブログと同じように新規アカウントを作ることをおすすめする。メインの人格でやってしまうと、取り返しがつかないミスをしてしまうこともありえるからだ。
あなたが何かしらのエンタメが好きなら、そのエンタメの感想や考察をつぶやいてみるといい。このときもブログと同じように新規アカウントを作ることをおすすめする。メインの人格でやってしまうと、取り返しがつかないミスをしてしまうこともありえるからだ。

失敗しても大丈夫な新規のアカウントなら、あなたも安心して言語化の練習ができるだろう@<fn>{erukiti-anonymous}。

失敗しても大丈夫な新規のアカウントなら、あなたも安心して言語化の練習ができるだろう。もちろん匿名性を過信して、誹謗中傷やその他犯罪行為を行えばその限りではない。
//footnote[erukiti-anonymous][もちろん匿名性を過信して、誹謗中傷など犯罪行為を行えばその限りではない。]

うまくいくことがわかれば、改めて自分のアイデンティティとなる名前で活動すればいい。

Expand Down
16 changes: 8 additions & 8 deletions src/chap-erukiti5.re
Original file line number Diff line number Diff line change
Expand Up @@ -363,17 +363,17 @@ Claude Sonnetやgpt-4oやo1のような十分に賢いモデルであれば、

とは言え、この手の要約だけだと、本当に軽めの要約にしかならないため、「読むべきか?」のフィルターとして使い、本当に読みたい論文なら、ここからさらに色々質問を投げるといいだろう。

* 埋め込みによる刈り込みの詳細を教えて。クエリの埋め込みとの類似度を見ている?でもそれだと、本来重要な文章を消してしまいそう
* クエリの埋め込みの方で工夫してることはない?そのまま埋め込み表現に変換してる?「HtmlRAGについて教えて」みたいなクエリをそのまま?
* 粗い粒度のブロックツリーは、サイズだけを気にしてる?
* ブロックツリーはどういうデータ表現?
* 埋め込みはHTMLのタグとかも含まれる?それとも文章だけ?クエリにはHTMLのタグが含まれないからその分、違いが出ると思うんだけど
* 埋め込みの作成はともかく、LLMを何回も走らせるとコストが問題になると思うけど、そこについての教えて
* 埋め込みでの刈り込みで8Ktokensまで減ってるんなら、いっそそのままで良くない?
* 埋め込みによる刈り込みの詳細を教えて。クエリの埋め込みとの類似度を見ている?でもそれだと、本来重要な文章を消してしまいそう
* クエリの埋め込みの方で工夫してることはない?そのまま埋め込み表現に変換してる?「HtmlRAGについて教えて」みたいなクエリをそのまま?
* 粗い粒度のブロックツリーは、サイズだけを気にしてる?
* ブロックツリーはどういうデータ表現?
* 埋め込みはHTMLのタグとかも含まれる?それとも文章だけ?クエリにはHTMLのタグが含まれないからその分、違いが出ると思うんだけど
* 埋め込みの作成はともかく、LLMを何回も走らせるとコストが問題になると思うけど、そこについての教えて
* 埋め込みでの刈り込みで8Ktokensまで減ってるんなら、いっそそのままで良くない?

最初にHtmlRAGを知ったときはこのような質問を投げていた。結果に関しては紙面を取り過ぎるので割愛しよう。

筆者はしがない専門学校卒なため、論文には疎いのだが対話型AIを活用すれば、自分に合った説明をいくらでも引き出せる。質問が思いつかない場合は、「あまり理解できてなくて質問が思いつかないんだけど、いい質問例はある?10個上げてみて」と聞いてみるのも有効だ。
筆者はしがない専門学校卒なため論文には疎いのだが、対話型AIを活用すれば、自分に合った説明をいくらでも引き出せる。質問が思いつかない場合は、「あまり理解できてなくて質問が思いつかないんだけど、いい質問例はある?10個上げてみて」と聞いてみるのも有効だ。

//emlist[Claude Sonnetが挙げた質問例]{
* 従来のRAGシステムがHTMLをプレーンテキストに変換する際に、具体的にどのような情報が失われているのですか?実例を挙げて説明してください。
Expand Down

0 comments on commit 972c04e

Please sign in to comment.