歸剛誒AI

歸剛欸,AI 又進步了——每天幫你盯 AI 圈的台灣人日報

← 回首頁 · 回第 23 期(2026-07-02)
研究・2026-07-02

SWE-Interact:把寫程式 benchmark 改成『使用者一路來回下指令』的多輪任務

c

o

d

i

n

g

a

g

e

n

t

a

g

e

n

t

調

S

W

E

-

I

n

t

e

r

a

c

t

c

o

d

i

n

g

a

g

e

n

t

使

使

a

g

e

n

t

A

I

S

W

E

-

I

n

t

e

r

a

c

t

a

g

e

n

t

A

I

M

a

x

A

I

a

g

e

n

t

c

o

d

i

n

g

歸剛點評|真實開發是邊做邊講清楚需求,不是一次把規格丟給 AI 讓它自己跑完。SWE-Interact 把評測拉到『多輪協作』這個更貼近日常的維度。對每天靠 AI 寫程式、修腳本的人,選工具該看的是它聽不聽得懂你半路改的需求,而不只是能不能通關乾淨題目。

同期其他文章