我們使用AI,但沒有真正了解,它在繁體中文的功效。

去年底iKala開源AI繁體中文測試資料,來源是各類台灣國家考試題庫,GPT-4做出來的約有六十幾分,但多數開源模型考出來僅有二十幾分。這測試是四選一的選擇題,代表答對率與用猜的差不多。

但這種模型測試,如果是英文,通常可以拿到九十幾分的成績