[B! LLM] [8ページ] stealthinuのブックマーク

https://twitter.com/izutorishima/status/1771480148602200538

stealthinu 2024/03/24

なぜ日本語？と思ったら、これってエヴァのセリフなんだね。ほんとにAGI完成でtweetされたものだとしたらちょっと歴史に残りそう。

リンク

Sakana AI

概要 Sakana AIは進化や集合知などの自然界の原理を応用して基盤モデルを開発することを目指しています。私達の目標は、モデルを自ら訓練し開発することだけではありません。基盤モデルの開発を効率化、高度化、自動化するための新たな手法を生み出すことに挑戦しています。この目標に向けた第一歩として、私たちはプレプリント「Evolutionary Optimization of Model Merging Recipes （モデルマージの進化的最適化）」を公開しました。このリリースの要点は以下の通りです。進化的モデルマージという手法を提案します。これは、多様な能力を持つ幅広いオープンソースモデルを融合（マージ）して新たな基盤モデルを構築するための方法を、進化的アルゴリズムを用いて発見する手法です。私たちの手法は、ユーザーが指定した能力に長けた新しい基盤モデルを自動的に作成することができます。既

stealthinu 2024/03/22

モデルマージを進化的アルゴリズム使って最適化させることで学習なく高性能なモデルを作り出すという手法。これは思ってなかったところからの手法だった。すごい！

リンク

GitHub、脆弱性のあるコードの自動修正機能発表。AIボットが修正済みコードと解説をプルリクエスト

GitHubは、脆弱性のあるコードをAIボットが自動的に発見、修正したコードとその解説をプルリクエストしてくれる「code scanning autofix」（コードスキャン自動修正機能）を発表しました。 Meet code scanning autofix, the new AI security expertise now built into GitHub Advanced Security! https://t.co/cTDuKZCWMv — GitHub (@github) March 20, 2024 下記がそのコードスキャン自動修正機能の説明です。「Found means fixed: Introducing code scanning autofix, powered by GitHub Copilot and CodeQL」から引用します。 Powered by GitH

stealthinu 2024/03/22

おおー！なんというかLLM使ったサービスがちゃんと社会実装されてきたな。

リンク

NVIDIA、1パッケージに2ダイの新型GPU「Blackwell」。AI性能は学習4倍、推論30倍に

stealthinu 2024/03/19

推論だけどうやってそんな速くなるんだろ？と思ったらFP4対応なんだ。4bitでfloatって想像しにくいがまあわかる。

リンク

neue cc - Claudia - Anthropic ClaudeのC# SDKと現代的なC#によるウェブAPIクライアントの作り方

AI関連、競合は現れども、性能的にやはりOpenAI一強なのかなぁというところに現れたAnthropic Claude 3は、確かに明らかに性能がいい、GPT-4を凌駕している……！というわけで大いに気に入った（ついでに最近のOpenAIのムーブが気に入らない）ので、C#で使い倒していきたい！そこで、まずはSDKがないので非公式SDKを作りました。こないだまでプレビュー版を流していたのですが、今回v1.0.0として出します。ライブラリ名は、Claudeだから、Claudiaです！.NET全般で使えるのと、Unity(Runtime/Editor双方)でも動作確認をしているので、アイディア次第で色々活用できると思います。 GitHub - Cysharp/Claudia 今回のSDKを作るにあたっての設計指針の一番目は、公式のPython SDKやTypeScript SDKと限りなく似せる

stealthinu 2024/03/18

C#からCalude3のAPIを呼ぶライブラリCaludia。Cysharpの人が書かれてるから安心して使える。C#から使うのならこれ一択だな。

リンク

Prefill Claude's response for greater output control - Anthropic

stealthinu 2024/03/18

プロンプトで得たい答えの頭がわかっているものなら、それをプロンプトで書いてしまうという手法。例えば「Answer: {」とするとJSONへ強く寄せることができる。キャラクターのロールプレイなども。

リンク

Claude 3 Haiku の概要｜npaka

以下の記事が面白かったので、簡単にまとめました。・Claude 3 Haiku: our fastest model yet 1. Claude 3 Haiku の概要本日 (2024年3月14日)、最速かつ最も低価格なモデル「Claude 3 Haiku」がリリースされました。「Claude API」および「claude.ai」のClaude Proサブスクリプションで利用可能です。「Amazon Bedrock」と「Google Cloud Vertex AI」には間もなく導入される予定です。 1-1. 速度「Claude 3 Haiku」は、32,000トークン未満のプロンプトに対して1秒あたり 21,000 トークン (約 30 ページ) [1] を処理します。カスタマーサポートなど即時性が求められるサービスで役立ちます。 1-2. 低価格「Claude 3 Haiku」の価格

stealthinu 2024/03/16

HaikuはGPT-3.5/Gemini1.0Proよりも性能良いのにちょっと安くて、そしてレスポンスが速いのがウリらしい。リアルタイム応答が欲しい音声応答とかに良さそう。

リンク

Swallow-MX: Mixtral日本語継続事前学習MoEモデル

はじめに東京工業大学横田研究室の藤井です。本日(2024/03/11)Mixtral-8x7B-Instruct-v0.1から日本語継続事前学習を行ったSwallow-MX-8x7b-NVE-v0.1をリリースさせて頂きました。本モデルの開発は、産総研、東京工業大学岡崎研究室、横田研究室の合同プロジェクトにて行われました。公式プロジェクトページはこちらです。 Swallow-MX はMoE(Mixture of Expert)モデルの継続事前学習モデルであり、Denseモデルにおいて有効性が示されている継続事前学習手法がMoEモデルにおいても有効であることを示す結果が得られました。 Denseモデルに対する継続事前学習に関しては、以下のブログやNLP2024の我々の論文をご覧ください。リリースモデル日本語継続事前学習済みモデル Swallow-MX-8x7b-NVE-v0.1

stealthinu 2024/03/15

8x7bって7bのエキスパートモデルが8個あるってイメージでいいのかな？

リンク

Prompt Tuning から Fine Tuning への移行時期推定

公開されている大規模言語モデルをどの程度のデータで Fine Tuning すれば Claude や ChatGPT などの API 公開されているモデルの精度に匹敵するのか検証した資料です。言語処理学会第30回年次大会併設ワークショップ日本語言語資源の構築と利用性の向上 (JLR2024…

stealthinu 2024/03/15

fine-tuningはRAGより効果ない的な評価が多くてあんまりと思ってたけどプロンプトチューニングだけに頼るよりfine-tuningしたほうがいい場合もあるよという報告。あとfew-shotは2件程度で十分らしい。

リンク

Claude3にプロジェクト全体をぶち込むためのプロジェクトの構造とファイル内容を自動でまとめるPythonスクリプト

はじめに Claude3Opusはものすごい能力で、手動で作成するのは面倒なプロジェクトのドキュメンテーションなどを一撃で生成してくれます。しかし、プロジェクト全体の内容をWebのCladeには投入できないし、ファイルを１個ずつコピペするのもかなり時間を要します。頼みのCursorもClaudeは対応していないので@Codebase機能が利用できません・・・そこで、Pythonスクリプトを使ってプロジェクトのフォルダ構造とファイルの内容を自動的にまとめるスクリプトを作成したので紹介します！このスクリプトを使うことで、プロジェクトを200kトークンまでの単一のテキストにまとめ、Claude3Opusに簡単に投入できるようになります。スクリプトの機能と使い方このPythonスクリプトは以下のような機能を持っています：プロジェクトのフォルダ構造をMarkdown形式で生成。※本当は

stealthinu 2024/03/15

ディレクトリ以下を全部単一テキストにまとめてLLMに渡せるようにしてくれるツール。CursorではClaude3に対応してないからこれでまとめて渡すと色々聞けるようになる、と。

リンク

ChatGPTが証明した「モラベックのパラドックス」とは？

1963年、群馬県生まれ。作家・ジャーナリスト、KDDI総合研究所・リサーチフェロー、情報セキュリティ大学院大学客員准教授。東京大学理学部物理学科卒業。同大学院理学系研究科を修了後、雑誌記者などを経てボストン大学に留学、マスコミ論を専攻。ニューヨークで新聞社勤務、慶應義塾大学メディア・コミュニケーション研究所などで教鞭を執った後、現職。著書に『ゼロからわかる量子コンピュータ』『仕事の未来～「ジョブ・オートメーション」の罠と「ギグ・エコノミー」の現実』『AIの衝撃～人工知能は人類の敵か』『ゲノム編集とは何か～「DNAのメス」クリスパーの衝撃』（いずれも講談社現代新書）、『「スパコン富岳」後の日本～科学技術立国は復活できるか』（中公新書ラクレ）、『ゲノム編集から始まる新世界～超先端バイオ技術がヒトとビジネスを変える』（朝日新聞出版）、『AIが人間を殺す日～車、医療、兵器に組み込まれる人工知能』

stealthinu 2024/03/14

『一般的な認識に反して、実際には肉体労働のほうが頭脳労働よりも難度の高い作業』を「モラベックのパラドックス」と名前がついてる。肉体労働のほうが後から自動化されるという考え方。

リンク

Cognition | Blog

Devin December '24 Product Update (Part 2) December 23, 2024 by The Cognition Team Over the last 2-3 weeks, we've made Devin faster, more cost-efficient, and more customizable. Issues that caused Devin to crash or get stuck have been fixed. Announcing: The Devin Open Source Initiative December 12, 2024 by The Cognition Team OSS contributions Devin has already helped to make, and more about our Ope

stealthinu 2024/03/13

CognitionというAIエージェント。OpenInterpreter的なものだけど内部にコマンドライン、エディタ、ブラウザを持っていてそれらを操作しながら仕事を進める。だいぶ高度なことまで可能。

リンク

GitHub - nu-dialogue/real-persona-chat: RealPersonaChat: A Realistic Persona Chat Corpus with Interlocutors' Own Personalities

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

stealthinu 2024/03/13

リアルな会話の話者IDとそのペルソナ付きコーパス。単に色んな人の音声データというだけではなく続きの会話になっているので、どんな属性の人がどんな話をしたかという情報も取れる。すげえ。

リンク

Sentencepiece : ニューラル言語処理向けトークナイザ - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 少し時間が経ってしまいましたが、Sentencepiceというニューラル言語処理向けのトークナイザ・脱トークナイザを公開しました。MeCabやKyTeaといった単語分割ソフトウエアとは趣旨や目的が異なるソフトウェアですので、少し丁寧にSentencepieceの背景、応用、実験結果等をお話したいと思います。サブワードニューラル言語処理の中心となる要素技術にLSTM (RNN)があります。テキスト(トークン列)を低次元のベクトルに符号化したり、ベクトルからテキストを復号化したり、その応用範囲は多岐にわたります。ニューラル機械翻訳 (N

stealthinu 2024/03/13

最近のLLMでだいたい使われているトークナイザSentencepieceが作られた背景やサブワードという重要な特徴について開発者の方の解説。

リンク

RAGでの回答精度向上のためのテクニック集（応用編-B）

はじめまして。株式会社ナレッジセンスの門脇です。普段はエンジニア兼PMとして、「社内データに基づいて回答してくれる」チャットボットをエンタープライズ企業向けに提供しています（一応、200社以上に導入実績あり）。ここで開発しているチャットボットは、ChatGPTを始めとしたLLM（Large Language Models）を活用したサービスであり、その中でもRAG（Retrieval Augmented Generative）という仕組みをガッツリ利用しています。本記事では、RAG精度向上のための知見を共有していきます。はじめにこの記事は何この記事は、LlamaIndexのAndrei氏による『A Cheat Sheet and Some Recipes For Building Advanced RAG』[1]という記事で紹介されている「RAGに関するチートシート」について、And

stealthinu 2024/03/12

RAGで一旦抽出してからそれを元にLLMでリランキングしてフィルタリングし、その結果からさらにLLMで結論出すと良いらしい。時間がさらにかかるけど精度あがるならありか。

リンク

Home - Anthropic

Anthropic home pageEnglishSearch...Search...NavigationWelcomeUser GuidesAPI ReferencePrompt LibraryRelease NotesDeveloper NewsletterBuild with Learn how to get started with the Anthropic API and Claude. Help me get started with prompt caching…Explore the docs Get started with tools and guides Get startedMake your first API call in minutes. API ReferenceIntegrate and scale using our API and SDKs. A

stealthinu 2024/03/12

anthropic公式のclaude3用プロンプト集。claudeはXMLだけど細かく変えればGPTにも応用できそう。というか精度を比較してみたい。

リンク

Metacognitive Retrieval-Augmented Large Language Models

stealthinu 2024/03/08

出力前に一度その内容を見直して、あまり良くない回答だった場合にはその理由を考えて、その理由を元に再度RAGを検索する、という手法。5回くらいやると最高の結果となったと。

リンク

GPT開発の悩みの種「速度」「精度」「評価」の壁をどう超えるか

2024/3/6 Forkwell Library #45で登壇した際の資料です。名前の通りGPT開発の「速度」「精度」「評価」のそれぞれについて解説してます。近く大全↓とも統合するかと思いますが取り急ぎ。 https://speakerdeck.com/hirosatogamo/chat…

stealthinu 2024/03/07

主にRAGを使ったシステムでどうやって精度上げるか、評価するかをまとめた資料。現状の他の人達がどんな感じに開発してるか感じがつかめる。だいたい同じようなことをやってる。

リンク

GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultra、Command R+に同じ質問をして、回答結果を比較してみた - Qiita

GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultra、Command R+に同じ質問をして、回答結果を比較してみたPython AWSAzureOpenAI GoogleCloud はじめに GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultra(Gemini Advanced)、Command R+に同じ質問をして、回答結果を比較してみました。 Gemini Ultra以外のモデルはPythonコード上から実行し、Gemini UltraはGemini Advancedのチャット上で実行していま

stealthinu 2024/03/06

結構多くの人がClaude3がGPT-4よりもよい！と言ってたけどこうやって比較するとすべてにおいてGPT-4より良いというわけではなさそう。だが少なくともGPT-4と並ぶ感じではありそう。

リンク

BitNetから始める量子化入門

はじめに Bit Net、最近話題になっていますね。そもそも量子化って何？という方もいると思うので、この記事は DeepLearning の量子化から入り、その上で Bit Net の触りについて見ていこうと思います。色々とわかってないことがあり、誤読してそうなところはそう書いてるのでご了承ください。図を作るのは面倒だったので、様々な偉大な先人様方の図やスライドを引用させていただきます。量子化 DeepLearning における量子化 DeepLearning の学習・推論は基本 float32 で行います。これを int8 や Nbit に離散化することを量子化といいます。計算に使う値は、モデルの重み、アクティベーション（ReLUとか通した後）、重みの勾配等があります。学習時については一旦置いておいて、この記事では推論における量子化について焦点をあてます。推論時に量子化の対象となる

stealthinu 2024/03/03

まっくすさんのBitNet解説。量子化についての説明つき。

リンク

はてなブックマーク

タグ

関連タグで絞り込む (47)

LLMに関するstealthinuのブックマーク (312)

お知らせ

今週のはてなブックマーク数ランキング（2025年3月第1週）

今週のはてなブックマーク数ランキング（2025年2月第4週）

今週のはてなブックマーク数ランキング（2025年2月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス