AIっていうかTransformer、まずコンテキスト長に対して二乗で比例するところがどないかならんとエッジデバイスでLLM動かすっつったってなあにしかならへん気がする