タグ: 自動化
「自動化」に関連する記事を表示しています。
Ai2がLLM評価ツールをOSS公開、マジでヤバい
Ai2がLLM評価ワークベンチ「olmo-eval」をOSS公開。既存ツールとの違いや設計思想を速報でまとめた。
続きを読むAmazonの倉庫ロボに話しかけられる時代が来た
Amazonが倉庫ロボ「Proteus」の新バージョンを発表。専用ソフト不要、普通の言葉で指示を出せるようになった。日本でもこの波は来る。
続きを読むLiteLLM v1.84.5のDocker署名、自分の環境に入れた
LiteLLM v1.84.5でDocker imageのcosign署名検証が整備された。commit hash固定で公開鍵を引っ張る方式と、CI/CDへの組み込み方を実際に手を動かして確認した。
続きを読むAIの「壊れ方」を学習させる手法がヤバい件
AIが同じテキストをループし続ける失敗を、失敗した出力そのものに学ばせて直す手法が登場。平均59.4%削減という数値がヤバかった。
続きを読むGoogleがI/O 2026でGeminiを自分たちに使った話
Google I/O 2026でGeminiを制作に使ったという話を読んで、自分のPRレビュー自動化スクリプトに引きつけて考えてみた。
続きを読むCodexがKnowledge Workに来た話を読んで思ったこと
OpenAIのCodexレポートを読んで、自分のNotionパイプラインをどこからリファクタリングするか考えた話。APIコストと設計判断の視点で整理してみた。
続きを読むシステム連携の話、顧問先に説明できますか
顧問先の建設会社から「システムをまとめたい」と相談を受けた。ノーコード連携のニュースを読んで、中小企業の現実と照らし合わせて考えたこと。
続きを読むlitellm v1.84.4 のcosign署名、自分のDocker運用に入れた話
litellm v1.84.4 のリリースノートで cosign 署名検証を知り、実際に CI に組み込んだ話。digest pin と verify の両方を入れたら思ったより簡単だった。
続きを読むAI臭さを消すClaude Codeスキル「Humanizer」を試した
Claude CodeスキルのHumanizerを導入してみた。29パターンでAI臭さを検出し、ボイスキャリブレーションで自分の文体を再現できる。PR descriptionに即使いたい。
続きを読むCodexとGPT-4.5でエンジニアが動く話を聞いて思ったこと
BraintrustがCodexとGPT-4.5で開発サイクルを圧縮している話を読んで、採用・投資家説明・PMFへの影響を即座に考えた。
続きを読むOpenAIのCodexで企業がエージェント組織に変わってるらしい
EndavaがCodexで要件分析を数週間から数時間に短縮したらしい。「エージェント組織」という考え方、日本でも広まる前に押さえておきたい。
続きを読むCiscoとOpenAIがCodexで組んだ話、マジでヤバい
CiscoがOpenAIのCodexでエンジニアリングを刷新というニュースが流れてきた。不具合の自動修正、AI Defense加速——海外大手が動き始めたこのフェーズ、日本はどこにいる?
続きを読む