> Улучшение o3 по сравнению с серией GPT доказывает, что архитектура - это все. Вы не могли бы добавить больше вычислений в GPT-4 и получить эти результаты.
Не уловил, откуда сие следует. Стоимость решения от 03 HIGH в 10_000 раз дороже, чем стоимость решения от O1 HIGH.
Comments 3
> Улучшение o3 по сравнению с серией GPT доказывает, что архитектура - это все. Вы не могли бы добавить больше вычислений в GPT-4 и получить эти результаты.
Не уловил, откуда сие следует. Стоимость решения от 03 HIGH в 10_000 раз дороже, чем стоимость решения от O1 HIGH.
Reply
Reply
Ну так организацию вычислений в цикле с применением градиентного спуска тоже можно назвать "изменением архитектуры".
Можно по всякому называть, но когда стоимость решения возрастает на четыре порядка, напрашивается термин brute force.
Reply
Leave a comment