歸剛誒AI

歸剛欸,AI 又進步了——每天幫你盯 AI 圈的台灣人日報

← 回首頁 · 回第 23 期(2026-07-02)
模型・2026-07-02

Gemma 4 上 Cerebras 衝到每秒 1800 token,讓即時語音 AI 真的能用

G

o

o

g

l

e

D

e

e

p

M

i

n

d

G

e

m

m

a

4

C

e

r

e

b

r

a

s

G

e

m

m

a

4

E

2

B

E

4

B

3

1

B

2

6

B

-

A

4

B

M

o

E

A

p

a

c

h

e

2

E

2

B

E

4

B

1

2

B

a

g

e

n

t

G

e

m

m

a

4

3

1

B

C

e

r

e

b

r

a

s

I

n

f

e

r

e

n

c

e

1

8

0

0

t

o

k

e

n

t

o

k

e

n

1

.

5

C

e

r

e

b

r

a

s

G

e

m

m

a

4

6

2

9

G

e

m

m

a

4

3

1

B

C

e

r

e

b

r

a

s

I

n

f

e

r

e

n

c

e

C

l

o

u

d

A

I

a

g

e

n

t

A

p

a

c

h

e

2

M

a

c

O

l

l

a

m

a

歸剛點評|即時語音 AI 卡了很久的『延遲』問題被硬體端解掉了一大半。開源多模態+每秒 1800 token 的組合,把語音助理、即時口譯這類應用的門檻拉低。想做語音產品的台灣團隊,現在有了不必自建旗艦模型的可行路徑。
來源:Hugging Face · Cerebras · Hugging Face Blog

同期其他文章