Profile avatar
tmaehara.bsky.social
https://tmaehara.gitlab.io/; TCS Researcher & ML Engineer. Brilliant British Foods: https://bsky.app/profile/did:plc:dqxsa5cjfrzulhalom4kuyd2/feed/aaaiqwjhlzavy Bluesky Bots https://gitlab.com/tmaehara/bluesky-newsbots
2,351 posts 1,188 followers 790 following
Prolific Poster
Conversation Starter

これは放言なんだけど,いま我々が AI (esp., LLM) に見てるのはマクロな現象だと思ってて,一方で TCS は原則ミクロのアプローチだから,何かしらマクロ CS 的なものが欲しいんだと思う.大量に計算機能が集まったときに粗視化して何が言えるか的なやつ.

懸念はとてもよくわかるけど,実際 STOC に通せそうなネタで AI っぽいやつあんまり思い浮かばん.

One thing that is conspicuously missing at STOC 2025 is everything related to the modern generative AI revolution, LLMs, chatbots, etc. Most of the talks are such that it's hard to say if it's year 2020 or 2025. Where is all the work along the lines of "AI for TCS" and "TCS for AI" happening?

つまぴっぴ,Life in the UK テストに3日くらいの詰め込みで合格してしまった…….

ジャヴァコードを書いてるといろんな穴を踏むので Rust が恋しい.Rust で面倒だなあと思ってたものがことごとく牙を剥くのでリファクタリングが常に Rust 風にするところから始まる.

それなりに綺麗なアーキテクチャに落ち着いたとは思ってるけど,わたしが見落としてる課題もあると思ってるので,各位の実装方針(&そこに行き着いた経緯)も共有していただけるとありがたく

以下 LLM-based で chat botを作るメモ.

Claude Code をぶん回してお仕事をするのを試してるんだけど,正直仕事の負荷が結構下がって効率が結構上がるという良いことしかない状態でだいぶ嬉しい.

ゆる募:ロンドン付近のおいしいシュラスコ屋さん

akinator 再現できるかとやってみたけど,とにかくデータベース作りがあまりに鬼門.どうなっとるんじゃあれ.

この Welsh Dragon 竜舞神速してきそう

British traditional Ultimate Carbonara

「LLM を使ったらよくある ML タスク(eg titanic)の性能が上がった」みたいな論文がちょっと前にあったんだけど、手元で調べたら当時の LLM が titanic の train/test 全暗記してることがわかってめっちゃ笑った覚えがある。

LLM-based chat bot を書いていると思ったらいつのまにか finite state transducer を書いていた

British traditional Sticky Toffee Pudding

Claude Code はじめました

一回しか起きないイベントにも確率論は当然使えますよ

MCP に API エンドポイントを全部突っ込んで適当にプランさせるやつ,自分用ツールとしてはとても便利だけどそのままアプリケーションにするのは全く向いてないな.これも規定の動作をしなくても困らないユースケース(自分用のアシスタント)と規定の動作をしないと困るユースケース(ユーザ向けのアシスタント)で景色が違うっぽい.

entity resolution めっちゃだるい.これ LLM 以前の人はどうやってたの…….

Stella Stella

まともに使える SNS が X しかないと、X が落ちたときに「X が落ちた」と呟けないので X 以外を優先して使ってます

https://pusheen.com/happy-fathers-day-2/

I see

Windsor Castle!

現状の LLM は、きちんと指示を与えたい文脈となんとなくやってくれればいい文脈でだいぶ扱い方に差があると思っていて、X とかでよく見る丁寧なプロンプトもきちんと指示を与えたい文脈だと避けた方がいい。とにかく目の前の指示だけをして、動的に続く指示出しを生成するほうがいい。 これを柔軟性を持たせた形でやろうとすると、だいたい簡単な言語処理系を書くことになる(なった)。

> LLM に自然言語で指示を出しているうちは過渡期,そのうち明確な指示を出しやすい形の言語ができる というのを見けど,現状でもまともなアプリケーションを作ろうとしたら validation のために tool を挟むのが定石になってるから,すでにこの時期は通過してると思う.例えば犬猫分類機を作るなら {"category": enum from ["dog", "cat"]} みたいなのをJSON-RPC で定義して入力を validate してエラーを返して自動でリトライさせてやればいい.これで「出力を dog or cat で返せ」を強制できる.

British Traditional Mango Lassi

audiala.com/ja/igirisu/s... Surau Igirisu

LLM で真面目になんかを作ろうとすると言語処理系を作るのに似たエフォートがいるなあ.しかも入力が曖昧なやつ.

MCP に未来を感じたので,社で自分が作った API を一通り MCP compatible にした.

確かに LLM にフルベットすると Claude Max Plan になるのはわかる気がしてきた.まあわたしは API 従量課金でしばらく行きますが…….

どうしても解消できない OOM github.com/apache/arrow... が原因と発覚

LLM + MCP すごいな.言葉を失うレベルですごい.