Цена экономии: как низкая точность губит большие языковые модели

Dec 22, 2024 10:31

Большие языковые модели (LLM) - это впечатляющий технологический прорыв, но их потенциал часто ограничивается инженерными решениями, направленными на оптимизацию производительности. В погоне за скоростью и экономией памяти, разработчики часто жертвуют точностью, используя форматы с пониженной точностью для представления весовых коэффициентов ( Read more... )

Leave a comment

Comments 1

igor_abramov December 22 2024, 10:28:05 UTC
>>> работа которой основана на многочисленных матричных операциях. Эти операции сводятся к решению СЛАУ.

Поясните, пожалуйста, что именно Вы имеете ввиду в этой фразе.
Мне казалось, что скорее наоборот - решение СЛАУ сводится к тем или иным матричным операциям.
На каких этапах тренировки или использования LLM мы реально делаем что-то похоже на решение СЛАУ ?

А по сути согласен - вопросу численной устойчивости мало внимания уделяется

Reply


Leave a comment

Up