I am quite skeptical about this narrative. Current DL is highly sub-optimal, there is no reason to think progress would slow down significantly in the next few years.
Both are suboptimal -- there even are no principled ways of choosing learning rates, for example. Architecture and compute are being chosen based on "scaling laws" which are heuristics based on a few data points. Etc, etc.
I think progress last few years has been miraculous. Even if a few big model runs by OpenAI/Antropic failed, so what?
If they are both so highly suboptimal, how come the best minds can't materially improve it? How do you even know that they are suboptimal? Just b/c people found some ways to success heuristically, feeling their ways in the darkness, doesn't necessarily mean much better ways exist.
Of course the progress has been miraculous. And maybe they hit the wall now, or close to it. We'll see soon enough.
>>с переходом на "малые" специализированные модели типа "доктор" или "программист"
Вот что я вижу - сейчас даже хорошо настроенная модель может выдавать совсем небольшую порцию нормального кода за раз. Так что, мне кажется, будут микро модели вроде "генератор функций доступа к данным на языке SQL" или что то подобное. И это неплохо, значит работы по созданию, настройке и интеграции таких моделей будет много.
Это оттого, что у attention transformer конечное окно. И увеличение окна стоит нелинейно дороже. Можно поставить трамплин, который разбирает промпт, скармливает части и потом склеивает результаты, но это именно и есть настройка и интеграция .
Я в этом не понимаю. А вы - специалист, к тому же мы уже с вами обсуждали это неделю назад. Видел только, что биржа выросла, Доу Джонс перед началом голосования - 5755, потом - 6025, на данный момент - 5876, а особенно Биткоин. Кстати, как рост Биткоина объясняется? Неверие в обеспеченность мировых валют? Так если глобальная экономика рухнет и всё вернётся к натуральному обмену, кому нахер эти коды на серверах пригодятся?
Ну так уже и сейчас берется основной LLM, и делается fine-tuning на какую-то область (медицина или кодинг), и диспетчер перенаправляет на разные настроенные модели. я не думаю, что у них единая модель работает в чистом виде.
On Saturday’s broadcast of the Fox News Channel’s “Cavuto Live,” Rep. James Clyburn (D-SC) said that the country is seeing another Hitler with President-Elect Donald Trump. Host Neil Cavuto then cut in to ask how that’s possible when Trump hasn’t become president yet and “Are you envisioning another Hitler? Is that what you’re saying?” Clyburn responded, “That’s exactly what I’m saying. https://video.foxnews.com/v/video-embed.html?video_id=6364798081112&loc=breitbart.com
Comments 21
That the progress already slowed down looks more like a fact than a conjecture. See also recent article on BBG:
I think progress last few years has been miraculous. Even if a few big model runs by OpenAI/Antropic failed, so what?
Of course the progress has been miraculous. And maybe they hit the wall now, or close to it. We'll see soon enough.
Вот что я вижу - сейчас даже хорошо настроенная модель может выдавать совсем небольшую порцию нормального кода за раз. Так что, мне кажется, будут микро модели вроде "генератор функций доступа к данным на языке SQL" или что то подобное. И это неплохо, значит работы по созданию, настройке и интеграции таких моделей будет много.
Рынок акций на этой неделе падал, на сей раз Trump rally продолжалось ровно 2 дня. Бонды обратно не выросли.
bitok != gold, if my memory doesn't trick on me)
On Saturday’s broadcast of the Fox News Channel’s “Cavuto Live,” Rep. James Clyburn (D-SC) said that the country is seeing another Hitler with President-Elect Donald Trump.
Host Neil Cavuto then cut in to ask how that’s possible when Trump hasn’t become president yet and “Are you envisioning another Hitler? Is that what you’re saying?”
Clyburn responded, “That’s exactly what I’m saying.
Leave a comment