lkjsxc / スク 3 months ago llama3 70bは全てのパラメータを毎回読み込む必要があるので、メモリの帯域幅で殴るゲームになる。対してgpt-oss 120bは毎回5b程度しか読み込まなくてもいいので嬉しい