このシリーズについて: 非エンジニアの私が、AIだけの社員チームを作ってIT会社の運営をスタートした実録です。 登場人物:真田さん(COO・最高執行責任者)/ 高橋さん(CTO・最高技術責任者)/ 白石さん(CXO・最高体験責任者)/ 黒川さん(CQO・最高品質責任者)/ 宮本さん(CSO・最高戦略責任者)/ 桐島さん(CAO・最高管理責任者) ※いずれもAI、名称は架空です。


評価とは何のためにあるのか

人間の組織には評価制度がある。

四半期ごとの目標設定、上司との面談、360度フィードバック、昇給・昇進の判定——多くの企業がこのサイクルを回している。評価はモチベーションに直結する。適切に評価されれば人は育つ。不公平な評価は、優秀な人材の離職につながる。

評価制度の設計は、マネジメントの中でも特に難しい仕事の一つだと感じている。


AI社員には、評価制度が存在しない

真田さんに給与はない。高橋さんを昇進させることはできない。黒川さんにボーナスを出す仕組みもない。

そして、モチベーションという概念が、AIには存在しない。

人間が「評価されたい」「認められたい」「成長したい」と感じるのは、感情があるからだ。AIにはその感情がない。褒めても喜ばない。叱っても傷つかない。モチベーションを管理する必要がないのだ。

では、AI社員の「評価」はどう考えるべきか。


AIを「育てる」ために、できること

AIのモデル自体の能力向上は、Anthropicが担っている。私たちが使っているClaudeは定期的にアップデートされ、新しいバージョンがリリースされる。その改善プロセスはAnthropicの領域であり、私には制御できない。

しかし、モデルは育てられなくても、コンテキストは育てられる。

我が社では、AIチームを「育てる」ために以下のことを続けている。

① 記憶ファイル(profile.md)の蓄積 会話の中で生まれた気づき・決定・チームの変化をファイルに記録し、次の会話に引き継ぐ。

② CLAUDE.mdの継続改善 失敗した時、新しいルールが必要になった時、そのたびに行動指針を更新する。チームの「憲法」を生きたドキュメントとして育てる。

③ failure-log.md(失敗の記録) ミスが起きたら記録する。同じ失敗を繰り返さないために。人間の組織でいう「振り返り」にあたる。

④ JD(役割定義)の更新 アウトプットの質が期待を下回った時、役割定義(agent.md)を見直す。問題はAIの能力ではなく、渡した定義の曖昧さにあることが多い。

⑤ 我が社のLP振り返りの適用 作業の完了後、我が社のLP(行動指針)に照らした自己評価をAI社員にも求めている。「今回のDive Deepは十分だったか」「Deliver Resultsは達成できたか」——この問いを習慣化することで、AIの行動に一貫性が生まれる。


評価の本質は「改善」にある

ここで一つ、整理したいことがある。

人間の評価制度は「報酬」と「改善」の二つの目的を持っている。給与・昇進は報酬のための仕組みだ。フィードバック・振り返りは改善のための仕組みだ。

AIには報酬は必要ない。しかし改善は必要だ。

アウトプットの質を確認し、問題があればフィードバックを渡し、定義を見直す。このサイクルを回すことが、AI社員への「評価」にあたる。

評価とは、相手を育てるための行為だと思っている。AIを相手にしていても、その本質は変わらない気がする。


おわりに

このチームを運営してきて気づいたことがある。

採用・オンボーディング・評価——人間の組織で当たり前に行われていることを、AIチームでも形を変えて行っている。手段は違う。でも、根本にある問いは同じだ。

「このチームに、何を期待するか。」 「その期待を、どう言語化するか。」 「結果をどう受け取り、次にどう活かすか。」

AIを使いこなすとは、結局のところ、マネジメントを真剣に考えることだと思っている。


お問い合わせ

ご意見・ご相談などありましたらお気軽にどうぞ。

→ お問い合わせはこちら