ディスカッション (11件)
2022年以前に出版された、技術書やエンジニアリングの教養として欠かせない書籍についてまとめています。
僕がRubyの無料書籍を更新したくない理由の一つがこれだよ:https://leanpub.com/rubyisforfun 人の手で書かれたものだし、ずっとこのままにしておくつもり。更新しようと触った瞬間に日付が2022-05-26から2026年になっちゃって、それまでの価値が全部消えちゃうからね。
低バックグラウンド鋼について言及しなかった著者に拍手を送りたい。
ここ3年、リファレンス本については意識的にそうしてきたよ。AmazonがAI生成のノンフィクション本で溢れかえってるからね。自分なりの思想的な理由もあるけど、一番の問題は、そういったAI生成の参考資料の質がとにかくひどいってこと。安くプラットフォームを埋め尽くすことだけが目的だから、ファクトチェックも編集もレイアウトも、誰もまともにやってない。しかも、最高性能のモデルすら使ってないっていうね。
例えば、「Rust programming」とか「cybersecurity book」で検索すると、明らかにAI生成と思われるタイトルがトップページに出てくるんだ。「Winston Knowles」が実在の人物じゃないとは言い切れないけど、自分なら賭けはしないな:https://www.amazon.com/Cybersecurity-Career-Manual-Interviews-Entry-Level/dp/B0FH596V3R
そうそう、今トップランクに入ってる参考書の一つがこれ:https://www.amazon.com/100-000-Whys-Kids-Encyclopedia/dp/B0H2B1DH6L 「サンプルを読む」をクリックしてみて。どのイラストも明らかに間違ってるよ。ラベルの位置が変だったり、解剖学的にありえない描写があったりさ。
それに、2022年以降に書いたものが本当に自分で書いたものだと証明する手段もなくなっていくのかもね。昔、長い記事を全部自分の手で書いたんだ。検索にすらLLMは一切使わなかった。でも、いくつかのAI検知ツールでチェックしたら、自信満々に「記事の60%はAIによるもの」って判定されたよ。
2022年以前の本だけの問題じゃないよ。サプライチェーンの問題でもある。今までAmazonで、表紙は本物っぽいのに中身はAI生成のコピーテキストっていう古い本を2冊見たことがある。Amazonは返品を受け付けるだけで、たぶんそのまま次の犠牲者のために再入荷させてるんだろ。
最近は古本屋かeBayで、それも古い本や使い古された本を買うようにしてる。それが本物であることの良い証拠だからね。
自分だけじゃないよ。自分もハリー・ポッターの二次創作[1]を読むのが好きで、何か新しいものを探すときは公開日を確認するようになった。最初は無意識だったんだけど、あとから気づいたんだ。
「言うことすべてが正論で、完璧な立ち回りをするのに、なぜか何も感じない」とか、「直感で裏がある気がする」みたいな相手に会ったことはある?あれは僕たちが人生のどこかで一度は惑わされるマジックだよ。たぶん公開年で絞り込んでるのは、自分が騙されているのかどうかを考えたくないからだと思う。
[1] ワールドビルディング(世界観構築)は苦手だけど、めちゃくちゃ才能のある書き手[A]も中にはいるからね。
[A] 最近のお気に入り: https://archiveofourown.org/works/1134255/chapters/2292768
本だけじゃないよ。ネットで情報を検索するときも、ここ数年で大きく変わっていない内容なら、2023年より前に投稿されたSO/SE/HN/reddit等の記事を優先する。もしそれ以前の良い情報が見当たらなければ、古いものほど良いって判断するし。
もちろん、僕らみたいに考える人が増えてることに気づいて、SEO対策の一種として投稿日時を過去に改ざんするような奴らも間違いなく出てきてるだろうけどね…
誰よりも低品質な生成コンテンツ(slop)は嫌いだし、つい最近までは個人の投稿ややり取りでLLMを使うことに対して一切の妥協を許さない姿勢だった。でも今は少し考えが変わって、ごく限定的な使い方ならアリかなと思ってる。一つは、思い出せない言い回しを調べる時(50歳を過ぎるとこれが頻繁に起こるんだ)。もう一つは、長すぎる文章を分割する時。これは高校の頃から直らない悪癖なんだ。
投稿や段落の執筆・書き直しをLLMに任せることは絶対にしない。自分の言葉で、自分自身の声で書きたいんだ。自分はいい書き手だと思っているし、自分の書く文章が好きだから。でも、文章に自信がない人たちがLLMで下書きを「チェック」した結果、LLMの方が「響きがいい」からといってそのままコピペしてしまう誘惑に負けているんじゃないかと思う。書くのは難しいからね。でもそれは間違いだし、HNのような場所ではやるべきじゃない。失礼だし、僕らはLLMの文章じゃなくて、君自身の言葉とアイデアを聞きたいんだから。
悲しいのは、結局「投稿を書く時にLLMを一切使わない」か「LLMに投稿を丸投げする」かの二択になってしまっていることだね。
本棚にあるおすすめをいくつか紹介するよ:
Crafting Interpreters(Robert Nystrom著)
Re[Coding] America(Jennifer Pahlka著)
Systems Performance(Brendan Gregg著)
クリエイティブな分野における生成AIには猛烈に反対だけど、この指標は愚かだし、若い世代やこれからの世代に対して不公平だと思う。仮に生成AIによる執筆が向上したとしてもね。
もし現代の書き手が生成AIを使っていないか信用できないのなら、即興劇(インプロ)みたいに完全に信用できるクリエイティブな趣味を探したほうがいいよ。文章の盗用やカンニングなんて何十年も前から存在していたことだし。
とはいえ、僕の極端な意見を言わせてもらうと、社会は創作分野におけるAIを一切容認すべきではないと思ってる。Soraが閉鎖できるなら、LLMの無用で有害な部分だって排除できるはずだ。