世界を動かす技術を、日本語で。

Google翻訳が教えてくれる「バイブコーディング」について

概要

  • Google Translate の進化と機械翻訳の限界について考察
  • 翻訳者やプログラマー の職業消滅論に対する批判的視点
  • 機械翻訳と 人間の役割 の違いを具体例で解説
  • AIやLLM の実用性と現状の課題整理
  • 今後のAIの可能性と倫理的懸念の指摘

機械翻訳と職業の未来

  • 近年、 LLM(大規模言語モデル) の登場により「プログラマー不要論」が話題
  • 一方で、 全否定 する意見も根強い現状
  • 本質的な議論のため、 翻訳分野 の事例を参照
  • Google Translate は2016年からニューラル機械翻訳(NMT)を採用
  • 「機械翻訳で翻訳・通訳は不要」という主張は現場を知らない人の意見
  • 実際には 翻訳者・通訳者の求人 は増加傾向
  • 技術進歩で業務内容は変化したが、 AIとの共存 が進行中

翻訳者の本当の役割

  • 一般的なイメージでは「 単語や文法を機械的に変換」するだけと誤解されがち
  • 実際は 文脈把握・曖昧さの解消・文化的配慮 が重要
  • Google Translateは 直訳 は得意だが、 文化的ニュアンス には弱い
    • 例:ノルウェー語の「Jeg vil ha potetene」は英語に直訳すると失礼な印象
    • 英語では「Could I please have some potatoes?」のような丁寧表現が必要
  • こうした違いは 裁判通訳 など重要な場面で特に問題

Google Translateの実際の使われ方

  • バイリンガルやプロは「 言いたいことは分かっているが、より自然な表現を探す」目的で活用
  • 一般観光客が「Google Translateで十分」と感じるのは、そもそも 通訳を雇うつもりがない層
  • Google Translateは 補助ツール として有用だが、 人間の判断力 には及ばない

プログラミングと翻訳の共通点

  • プログラミングも 曖昧な人間の要求絶対的なコンピュータ言語 に変換する作業
  • プログラマーの仕事も「 コードを量産するだけ」と誤解されがち
  • AIによるコード生成は進化したが、 抽象化や文脈理解 は依然として人間が必要
  • AIの進歩 で将来的に人間並みの文脈理解が可能になるかもしれないが、現状は未達

AIと倫理的・実用的課題

  • 現行のAIツール には倫理的な問題や負の外部性も存在
  • 生産性向上は限定的で、 倫理的懸念 を無視できない現状
  • AI開発者の多くは 責任ある出力 よりも「滑らかで違和感のない体験」を重視しがち

まとめ

  • Google TranslateやLLM は、あくまで 補助的なツール
  • 翻訳者・プログラマー の本質的な価値は 文脈や文化理解、創造性 にあり
  • AIの進化は職業の在り方を変えるが、 人間の役割は依然重要
  • 倫理や実用性 を考慮しつつ、AIとの共存が今後も続く見通し

Hackerたちの意見

これってひどい比較だと思う。Google翻訳はDeepLに完全に負けてるし、LLMなんて論外だよね。(Google翻訳はほぼ確実にLLMを使ってないし、少なくともそのスピードから考えると大きなLLMは使ってないと思う。)

GoogleのCloud Translation APIでは、標準のニューラル機械翻訳(NMT)モデルか、「翻訳LLM(Googleの最新の高品質LLMスタイルの翻訳モデル)」のどちらかを選べるよ。 https://cloud.google.com/translate/docs/advanced/translating... DeepLも翻訳LLMを持っていて、彼らはそれが従来のモデルより1.4〜1.7倍良いと主張している。: https://www.deepl.com/en/blog/next-gen-language-model

Google翻訳は実際、2016年からニューラル機械翻訳を使っていて、2023年にはPaLM 2(大規模言語モデル)を100以上の言語に統合したけど、DeepLは多くのベンチマークでまだ優れてるよね。

それはこの記事のポイントじゃないよ。この記事のポイントは、Google翻訳が導入されたときに、翻訳者が仕事を失うって言われたことなんだ。今のLLMについても、開発者が同じことを言われてるけど、実際にはそうならなかったし、これからもならないよ。DeepLはそのポイントには関係ない。もしかしたら、最終的には開発者がLLMの進化版に仕事を奪われるかもしれないけど、ここでは関係ない話だよ。

「翻訳者や通訳者の仕事は、主に文脈を確保し、あいまいさを乗り越え、文化的な配慮を扱うことです。これが今のGoogle翻訳にはできないことです。」 Google翻訳は無理だけど、十分な文脈があればLLMはできる。私は日本語と英語の翻訳にLLMを使って2年以上試行錯誤してきたけど、ちゃんとプロンプトを与えれば本当に優秀だよ。20年間フリーランスの翻訳者として働いてきた者として言うけど、今もパートタイムで翻訳してる。昨日も、Claude Codeで日本語と英語の翻訳用のマルチLLMシステムを作るために一日中作業してたんだ。翻訳したいテキストを与えると、翻訳の目的や、直訳か自由訳か、ターゲット言語の文化に合わせるかどうか、脚注をつけるかどうかなど、リアルタイムで質問をしてくる。それに基づいてプロンプトを作成し、OpenAI、Anthropic、Googleのモデルにテキストを送って、3つの翻訳から合成ドラフトを作成する。そしてそのドラフトを3つのモデルに送り返して、数回の修正、チェック、仕上げを行う。寝る前に実際のテキストでいくつかのテストを行う時間があったけど、結果は本当に良かった。単独のモデルよりも優れていて、Google翻訳よりもずっと良くて、トップレベルのプロの翻訳と同じくらいの品質だった。通訳、特に対面での通訳は状況が違うけど、もしそれで生計を立てていたら、まだあまり心配しないかも。でも、翻訳の仕事で翻訳者の個性やアイデンティティが強調されない場合は、人間が競争するのがますます難しくなってきてるね。

リアルタイム翻訳(通訳)にはSonioxを試してみて。リアルタイムでの限られた文脈の中でも、実際にかなり良いよ。 https://soniox.com ただし、私はSonioxで働いているから、その点は注意してね。

追加の文脈を提供したり、フォローアップの質問をしたり、テキストについて考えることがどれだけ重要かを伝えるのは難しい。私は日本に住んでるけど、ほぼ毎日「この特定の状況でXは何を意味するの?」とか「この特定の媒体でYをその特定の人にどう伝える?」ってことを考えてる。これらの多くはカスタム指示を使って自動化できるから、例えばLMMは特定の言語のテキストを自動的に翻訳して説明することを知っておくべきなんだよね。

あなたは利益の出るビジネスのためのソフトウェアを作ったんだね。人々はそれを使ってお金を払うだろう。

翻訳に関するLLMの問題は、翻訳するトピックがポリシーに従ってないときに、拒否されることだよね。文脈的には問題ないのに。自分の宗教について話すだけでも、そうなっちゃうことがある。

LLM翻訳についてかなり調べることになったのは、僕の言語学習ツール(https://nuenki.app)がそれを多く使ってるから。似たようなものを作って、オープンソースにしたんだ。僕の研究に基づいてトップのモデルを選んで、それで翻訳して、最後に評価モデルが批評、比較、そしてベストな翻訳を合成するって感じ。興味があったら、https://nuenki.app/translatorで試してみて。データはhttps://nuenki.app/blogにあるよ。

普通のコンテキストウィンドウに収まらない長いテキストをどう扱ってる?分割すると、前の部分の要約が必要になるけど、どれくらい詳しくすればいいのかいつも迷うんだよね。

翻訳者の仕事について人々が一般的に思い描いていることと現実の違いは、ピクサー映画が「ローカライズ」されることを思い出させる。日本版ではブロッコリーの代わりにグリーンビーンズが皿に乗っているのは、日本の子供たちが嫌いな食べ物だから。翻訳されたテキストを読むときに文化的な文脈が欠けていることが、歴史を学ぶのがやっと面白くなった理由だね。

もう一つの悪名高い例は、ポケモンのブロックの「ジャム入りドーナツ」だね。https://knowyourmeme.com/memes/brocks-jelly-doughnuts

あの豆の例って本当にあるの?もしそうなら、子供たちにそんなことをさせたくないな。他の国の映画を見る一番の楽しみは、その国の文化に触れて、自分の文化との違いを学ぶことだと思うから、そんな違いをなくそうとするのは理解できないよ。

この記事は多くのことについて的を射ていると思うけど、一つ見落としている点がある。 > 「このことを言う人たちは、Google翻訳がなかったら翻訳者を雇ったり、日本語を学んだりしていなかっただろうと思う。彼らは日本に行かなかったか、行ったとしても観光客のように何もわからない外国人になっていたはずだ。」 ここでの相関関係は、AIを使ってアプリを作っていた人たちは、そもそもアプリを作ることはなかっただろうから、ソフトウェア開発のキャリアにそれほど影響を与えているわけではないということ。AIアートがアーティストに影響を与えないと言うのは、そんなに努力しない人たちはそもそも誰かに依頼することはなかっただろうから、少しは真実かもしれない(少なくとも影響を減少させるという点では)。でも、ソフトウェア開発に関しては本当にそうかは分からない。ソフトウェアを作る能力は、非常に低コストで大きなビジネスチャンスを生み出したと思う。重要な違いは、今低い努力でソフトウェアを依頼している人たちは、以前はソフトウェアエンジニアを雇っていたかもしれないってこと。それが多くの数字に影響を与えるかもしれない。

逆に、仕事を生むかもしれない。なぜなら、パレードに象が多ければ多いほど、その後ろでほうきとバケツを持って歩く人の仕事も増えるから。何十年も「ユーザーが自分のソフトウェアを書くことを可能にするツール」を見てきたけど、どれもそれをきれいにしたり、スケールさせたり、安全にしたり、あるいはその混乱を片付けたりする人の需要を増やしてきた。

それを推測して、みんなが主に専門外のことにGenAIを使っていると言えるかもね。

Google翻訳は、全くの初心者には「ないよりマシ」って感じで、少し知識がある人には役立つし、プロの翻訳者の代わりにはならない良い例だよね。つまり、知識が増えるほど、その失敗が見えてくる。僕は小さい子供みたいに話せるくらいの日本語は知ってるし、タクシーでのちょっとした会話や、飲食店のメニューや看板は大体理解できる。何度も行ったからこそ、直訳じゃ伝わらない文脈も理解できるんだ。例えば、お客さんに「ノー」と言いたいけど、文字通りには言えないケースとかね。Google翻訳は、15年間日本に旅行してきた中で、スピード以外は大きな改善がないまま、魔法のようでもあり、バカみたいでもあった。リアルタイムの画像OCR機能は、以前使ってたアプリ(Magic Lens?)を買収したものだし。だから、もしかしたらLLMのコーディングも、10年間くらいは「まあまあ良いけど完璧じゃない」状態が続くのかもね。

君の言う通り、AIアートとAIソフトウェア開発は同じじゃないね。アートの目的はアートを作ることだから、これには多くの伝統や文化的期待があって、それは関わるアーティストによっても変わる。人間が関わることが重要なんだ。一方で、ソフトウェア開発の目的はコードを書くことじゃなくて、タスクを達成する動作するアプリケーションを作ることだよね。これが、たとえ低品質でも、多くの人を雇わずにできるなら、人間の価値はなくなっちゃう。HN的に言うと、モートがないってこと。絵画から写真への移行と、エレベーターのオペレーターからボタン押しへの移行の違いだね。

AIがコーダーの仕事を奪うという合理的な懸念は、既存のコーダーを劇的に生産的にするってことだよ。「生産性」は、Yの量の仕事をするために必要な人数Xとして文字通り定義される。非コーディングのバイブコーダーの脅威をどれだけ真剣に考えてるかは分からないけど、考えた方がいいかもね!世界で最も重要で人気のあるプログラミング環境はスプレッドシートだし、スプレッドシートが登場する前は、今のスプレッドシートにあたるものは、プログラマーが書かなきゃいけないプログラムだったんだ。

今、YouTubeで2種類の広告が出てるんだけど、一つは「イスラエルのガザ人道支援は全然問題ないよ」って内容(グレタ・トゥーンベリと一緒にフロティラの時に始まったやつ)。もう一つは「AI」ウェブサイトジェネレーターの広告で、動画の最初にスパムみたいに流れてくる。こんなマーケティングが必要な誠実な努力って、どんなものなんだろうね。

うん、AIアートの話は全然違うと思う。マクドナルド日本みたいに、アーティストへの報酬をちゃんと出してた大手ブランドが、今はAIアートを使ってるのを見るとね。

ここでの相関関係は、AIを使ってアプリを作ってた人たちが、以前はアプリを作ること自体なかったってことだね。だから、ソフトウェア開発の職業に与える影響は、最初に思ってたほど大きくないと思う。元のポイントや君の解釈は正しくないと思う。AIがソフトウェア開発の仕事を奪うことはないよ。人間の開発者がソフトウェアを作る需要はまだまだある。非技術系のマネージャーや経営者がAIツールを使って開発するなんて、BASICやCOBOL、SQL、NoCodeが出たときと同じくらい妄想的だと思う。ただ、AIは業界に二つの影響を与えるだろうね。まず、ソフトウェアを作るためのスキル要件が下がることで、ジュニアレベルのポジションを争う「バイブコーダー」が増える。これが有能なプログラマーの市場価値を薄めて、ソフトウェア業界に入るのがずっと難しくなる。関連する問題として、バイブコーダーは決してプログラマーにはなれない。彼らはソフトウェアを作ってテストする能力は持つけど、実際にプログラミングをしてデバッグやトラブルシューティング、問題を解決するスキルは学ばない。これが彼らや他の誰かにとって重要でないかもしれないけど、プログラミングとは別の職業だってことは覚えておいた方がいい。次に、バグやセキュリティ問題だらけの粗悪なソフトウェアで市場があふれることになる。品質が下がってユーザーがフラストレーションを感じるし、セキュリティホールが悪用されてデータ漏洩やプライバシー侵害、企業にとって計り知れない損失が増えるだろう。これらすべてがAIやバイブコーディングの拒絶につながり、1983年のビデオゲーム業界や2000年のドットコムバブルの崩壊に似た業界の崩壊を引き起こす可能性が高い。この現象はハイプサイクルの失望の谷の底で起こるだろう。もしAIツールが人間のシニアソフトウェアエンジニアを超えるレベルの能力を持ち、トラブルシューティングやバグのないソフトウェアを書く能力を持つようになれば、状況は変わるかもしれない。その場合、AIが自己改善できる状態になり、人間のエンジニアの需要は減るだろう。でも、今のAIツールのアーキテクチャがそこまで行けるとは思えないな。

「Google翻訳が悪い仕事をしているわけではない」とは言っても、Chromeの翻訳機能は、よく繁体字中国語を日本語として検出する。多くの文字が共有されているとはいえ、後者を検出するのはユニコードのコードポイントを比較すれば簡単だし、中国語にはかながないからね。この機能は以前は正しく検出してたけど、今は退化してる。最もイライラするのは、その間違いを修正させてくれないこと。現代のソフトウェアのルールとして、機械は自分が一番知ってると思ってるんだよね。

それはGoogle翻訳の問題じゃなくて、Google Chromeの問題っぽいね。Chromeは翻訳を提案する前に、この小さなデバイス上のモデルを使って言語を検出してると思うよ:https://github.com/google/cld3#readme

個人的には、まだ遅くないし、言語ごとにUnicodeを分けて再編成するのはいつでも可能だと思う。特に中国語と日本語は分けた方がいい。LLMは同時に中国語と日本語を扱うのが難しいみたいだし、両方の言語にとって意味があると思う。構文が違うだけじゃなくて、一般的に逆になってるし、なんか直感だけど、どっちがどの単語を修飾してるのか混乱してるように聞こえることもある。

彼らが1. 安い 2. 速い 3. 十分に良い LLMを持つのは時間の問題だと思う。それがGoogle翻訳の現在のモデルを置き換えることになるだろう。過去12ヶ月間で、Translateの現在のバージョンに1時間以上のメンテナンスをかけたとは思えないし、驚くよ。

確かな証拠ではないけど、翻訳者の友達がいて、実際に過去10年間で仕事が減ってきてるのは確かだし、LLMの登場でその傾向が加速してる。翻訳者向けのフォーラムやFacebookグループを見てみれば、AIについてはどこも悲観的な話ばかりだよ。例えば、このredditのスレッドを見てみて:https://www.reddit.com/r/TranslationStudies/comments/173okwg... プロの翻訳者はまだまだ質の高い翻訳を生み出してるけど、最もセンシティブな仕事を除いて、需要はほとんどなくなってる。子供にこの業界に入ることを勧める?

プロのチームでも、正確な翻訳が必要なクライアントと仕事をする時、LLMのおかげで一人で多くの仕事をこなせるようになったと思う。昔の自動翻訳とLLMの翻訳の質の違いはすごく大きい。以前は自動翻訳には全く頼れなかったけど、今はプロのサービスがLLMが出したものを編集するためのレビュアーだけで済むようになった。特定のトーンや方言で翻訳するようLLMに頼むこともできるし、すごく上手にやってくれるよ。

翻訳者がやる追加的なこと(プロの翻訳者の友達から聞いたことを自分の言葉でまとめた):* イディオム(この記事ではノルウェー語→英語ではあまり難しくないと触れられてるけど、イディオムは通常、文として翻訳できない) * 文化的参照(芸術、歴史、料理などから。必ずしも置き換えるわけじゃないけど、関連する意味合いを伝えるためにヒントを出す必要があるかも) * 文化的価値(「自由」がこの国では何を意味するのか、「情熱」が別の国ではどうか、また「レジリエンス」が別の国ではどうか、それが翻訳に影響するか) * 吹き替えの俳優に合わせる(本のセリフの翻訳が映画の俳優の動きやセリフの長さに合わないことがあるから、翻訳者が言葉を変えることがある) * 芸術的な文章(AFAICT、LLMはこれには本当に手が出せないと思う。正しい芸術的な部分を直接盗用しない限りね)

ノルウェーでは、食卓で「Jeg vil ha potetene」(直訳すると「私はポテトが欲しい」)って言うことが多いけど、イギリス人は「Could I please have some potatoes?」って言うかも。私は「I will have the potatoes」が全然問題ない英語だと思うし、全く傲慢じゃないと思うんだけど。これはイギリス英語とアメリカ英語の違いなのかな?

注文する時は「I will have」って言うのが合理的だよね。でも、誰かにポテトを渡してもらう時に、相手が目を見て「I will have the potatoes」ってまるで最後通告みたいに言ったら、ちょっと変だよね。

アメリカ人ってすごく礼儀正しいし、アメリカ英語は日常会話に礼儀がたくさん含まれてる。面白いことに、海外で観光客として過ごしていた時は気づかなかったけど、非アメリカの国に数年住んでみて初めて実感した。別の国に10年住んでたこともあるけど、アメリカの影響で気づかなかったんだよね。「今日はラテが欲しい」とか「ラテをもらえますか?」って言うのをシンガポールではやめた。みんな混乱しちゃうから。同じように、物を受け取る時にあまりにも丁寧すぎるのもダメ。礼儀正しさにはいろんな方法があるけど、通常は言葉を少なくする方がいいんだよね。そうしないと、みんな混乱しちゃうから。

声のトーンやボディランゲージにも依存するよね。

最近、ちょっと違う視点でこの比較を考えてたんだけど、翻訳(人間の翻訳でも機械翻訳でも)を扱う時の一つの課題は、自分で正しいかどうか確認できないことなんだよね。だから、翻訳を信じて、うまくいくことを願うしかない。機械より人を信じる方がずっと簡単だけど、以前に「あなたの記事の翻訳がひどすぎて、翻訳者が真剣にやってない感じがする」ってメッセージをもらったこともある。これは、ユーザーが自分で同じものを作る方法を本当に知らない「バイブコーディング」に似てる。出力が正しいかどうか全く分からないから、ただ盲目的に信じて、うまくいくことを願うしかない。それじゃあ、多くの状況にはうまくいかないよね。だから、結局は専門知識が必要なんだよ(自分のか他の誰かのか)。

いや、出力を実行することはできるよ。それである程度の正確さがわかる。

機械翻訳をある程度検証するには、円環翻訳(A→B→A)をやってみるといいよ。完璧なテストではないけど、かなり強い信号にはなる。

だから、翻訳を信じて、最善だと願うしかないんだ。機械より人を信じる方がずっと簡単だよ。機械が間違えると思ってるからね。大きな掛け算をする時は、数学者よりも計算機を信じる方がずっと楽だし、それは計算機の正確さに対する私の認識によるものだよ。

OSNewsに面白いのがあったよ: https://www.osnews.com/story/142469/that-time-ai-translation...