Nothing Special   »   [go: up one dir, main page]

2025-03-06

AIエージェントを導入して安く上げられるだろと無茶振りされる皆さんへ(Clineに全部賭けないで編)

コンニチハ、オイソギデスカ

非常に良くない生成AIビックウェーブが来ちゃったんで憂鬱な皆さんこんにちは

生産性が上がるとか効率が良くなるとか宮仕え(みやづかえ)だと、福音どころか地獄ですよね。

ぼちぼち日経新聞AIエージェント導入で他社に差をつけようみたいな記事を書く頃だと思うので、備えましょう。

まずいつも通り前提からな。

すでに出来ること

ほぼできてるけど安定しないこと

ここまでは前提な。

なぜシンドクなるのか

生産性が上がっても、別にお前の給料が上がるわけじゃないか

DeNAがさ、既存事業3000人の従業員を半分で回すようにするって目標立てたじゃん。つまり、1500人の業務負荷は倍になるのよね。

倍になったら普通は回らないところ、生成AI使えば倍でも回るでしょ?って言われてるわけだよね。

アレが非難されずに、素晴らしいとか、(諦め半分で)まあそうなるよねって言われてるのが全てなんだけどさ、シンドイよね。

生成AI業務効率化されてハッピー毎日定時で何なら毎週金曜日カジュアルフライデーで飲みながら仕事だ〜、とはならないんだよ株式会社特に

騙し騙しやってた業務が消えるから

経歴詐称して潜り込むってウッソだろというホワイトなみなさんは、パワポ作るとかペアプロするとか輪読会するとか適宜置き換えてください。

新規プロジェクトに入った時に、なんか資料もねえし、コードをぼちぼち読みながら、急ぎでもクリティカルでも無い部分を書いてレビューしてもらって修正してマージして、

みたいな作業が消えます。この辺もう既に出来るから生成AIで。

というか、すでにこのへん置き換えて楽してるやついるだろ。そうそこのお前。

クソみたいなプロトタイプが増えるから

今までも、華麗なる経歴とやらの人物が作り上げていったコード保守運営する時に相当キッツイことになってた人は多いでしょう。

ほら、新規事業でも何でも、とりあえず動いて売り上げ立てた人が偉いのはその通りなんだけど、それを直すのは大変なのよね。実運用の時には大抵転職してて居ないし。

でもさ、まあ言うても立ち上げの時期に技術負債とか考える余裕もなく速度重視でゴリゴリ作った人の立場になってみると、まあ仕方がなかっただろうな、と感情移入もできる。

これが、スーツが「動くものは作っておいたか簡単だよね?」とかAIの作ったクソコードの山をギークに渡すようになるんだぜ。腹立つことにハンパに動くやつを。

今までも「AWSポチポチしたらすぐでしょ?」とか言うクソスーツは居たけど、実際に手を動かしてモノ作ってくるスーツは概ねまともだっただろ?

今後、手を動かすスーツの手が全てプロンプトになる。

ここまでが、憂鬱になる理由な。

AIエージェントで何が本質的に変わったの?

なぜ今AIエージェントブームになろうとしてんの?

金払えば使えるようになったから。身も蓋もないけど。

いやXXやYYが違う!

本質的には、今までとあんまり変わってません。

あえて言えば、簡単にお試しできるようになった、と言うところが本質的な部分です。

以前からChatGPT4とかAmazon BedRockとか使ってた人ならわかると思うんだけど、別に今までもできたんだよね。

ただ、全自動で回せるパッケージングとしての品質がそれなりに高いので、お試しのハードルがぐっと下がった。

これ、API簡単スクリプトで以前から自動化できてたんだよね。(やってたやつは俺以外にも割といると思う)

決まったフォーマットで出力してもらって、そっから切り出して実行して、出たエラーをもう一回入れて修正して、動くようになったら止める。

出来上がったコードとそれまでの途中経過を全部まとめて入れて、最初から出来上がったコードにするためのプロンプト考えてってところまでをワンショット

あとは、出てきたコードプロンプトを眺めて良さそうなら採用する。この繰り返しでめっちゃ楽出来てた。(壊れたらDocker建て直せば良いし)

これを、そう言うスクリプト書いて整備して良い感じにGit管理してたお手製のツール大手が良い感じに作り上げてきちゃった感じ。あーあ。

まり、何ができるようになるの?

洗練された自動化と、スピードアップ

特に速度は分かりやす効率に影響するので、自営業とかプレイングマネージャとかは、今導入しても元がとれるだろうね。

じゃあ、なんでCline(とそれに類似するツール群)に全部賭けない方が良いかというと、まだ過渡期の技術から

ツールオペレーションに全振りして、大手が改良版出しちゃってオペレーターとしての職が無くなった経験、あるでしょ?

今Clineで不満に感じてることとか、プロンプト調整しなきゃなあみたいなところ、全部自動化できるでしょ。

一年保たないと思うよ。

AIエージェント導入時に絶対に阻止すること

そりゃあ人間雇ったら高えのはわかるけど、単一障害点は怖いぜ。

みんな、生成AIAPIが逆鞘だろうことはわかってるよね?急に明日から10倍に値上げされて耐えられますか?

今、OpenAPIのたけえのだってたかだか3万ぽっちだけど、あれに毎月30万円だせって言われて耐えられる?90万なら?SLAも怪しいのに?

そう言う時、「じゃあやめ人間雇えば良いじゃん」って言った時に、話聞いてくれる相手がいて欲しいよね?不義理しないでおこう。

同じように、新人ちゃんと育てるべきなんだけど、多分聞いちゃくれないから、そう言うところはドンヅマったら転職しよう。

経営側にいる人間は、安易AIエージェント+中堅に頼った場合、中堅がその会社急所になるのは抑えておこうね。引き抜かれて崩壊する組織脆弱だよ)

AIエージェントでは(まだ)出来ないこと

IBMが訴えられてるよね。アレ、AIエージェントあったら回避できてた?

俺は無理だと思う。

無茶振りされてる皆さんへ

試験導入しますね、と言ってガンガン使ってコストをあげましょう。予算が尽きるまで使えば概ねそこまでです。

また、AIエージェントを導入しつつ、動作確認したり、自社のどこに活用できるのか見ておくのはとても役に立ちます

具体的に言うと、ググったコマンドを片っ端から試すような新人が入ってくると思ってください。

その新人は、概ね1000行以下のコードなら即レスしてきます。変えるなと言った箇所もたまに結果を出すために変えたりします。

そして、その新人相手の知見はおそらくそんなに長くは持ちません。何故なら我々が不満に思う箇所は改善されてお出しされるからです。

そのため、Cline(やそれに類似するツール)の知見を貯めよう!なるほどこんなプロンプトを与えてやれば良いのか!みたいな試行錯誤はやめた方が無難です。

今後も解決されないであろう部分を切り分けるのに留めましょう。

超具体的に言うと、AWSコマンドを片っ端から試されたりすると、すげえ課金されるやつ、あるよね。でもそれちゃんポリシー制限できるよね。

人間相手常識で縛ってたことを、ポリシーで縛るようにちゃんとしておこうね、ミスったコードで高速にIaCお試しされるとすげえことになるよ。

(なりました)

まとめに変えて

仕様検討にはo1 pro modeが(推論が強いから)、コーディングはClaude 3.5 Sonnetが(コーディングに万能に強いから)、コードデバッグはo3-mini-highが(コードの解析に強いから)という時代から、Claude 3.7 SonnetのAPIセットしたClineで全部お任せして試行錯誤した方が結果的効率が良くなってます

今はPythonTypeScriptのように、基本的に大量にコード存在して生成AIを開発する側が良く使うコードの性能が高くなっています

(ただ、相当にマイナー言語であっても、別に学習に支障があるとは思えません。おそらく単に優先順位問題です)

AIコーディングについてのレポートをあげて、稟議を通すための理由もつけておくように」みたいな指示は、ChatGPTのDeepResarchに振って、上がってきたレポートをそれっぽく書いておけば良いです。

なお、ChatGPT4.5があんまり性能が出てないと聞いてがっかりしている人に朗報ですが、4oから4.5に変わったことで、相当に性能は上がっています

具体的に言うと、「クソみたいな上司からムカつく指示が来てどうにも収まらないんだけど、以下の内容を相手が納得するように書き直してくれない?」みたいなのに、すごい親身になってそれっぽい感じに書き直してくれます人間力は多分俺より上です。

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん