Революция в эффективности ИИ: Влияние алгоритма L-Mul

среда, ноябрь 13, 2024 12:00 ночи
1,717

Быстрое развитие искусственного интеллекта (ИИ) привело к значительным достижениям в различных секторах, однако это имеет высокую экологическую цену из-за его большого потребления энергии. Модели ИИ, особенно те, которые используют нейронные сети, требуют значительной вычислительной мощности, что приводит к огромному потреблению электроэнергии. Например, запуск ChatGPT в начале 2023 года потреблял примерно 564 МВтч электроэнергии в день, что эквивалентно потребностям в энергии около 18 000 домохозяйств в США. Этот энергетический спрос в первую очередь обусловлен сложными операциями с плавающей запятой, необходимыми для вычислений нейронных сетей, что делает поиск энергоэффективных решений критически важным по мере увеличения сложности систем ИИ.

Вводим алгоритм L-Mul (умножение с линейной сложностью), революционное развитие, которое обещает значительно снизить энергетическую нагрузку, связанную с вычислениями ИИ. L-Mul работает, приближая умножения с плавающей запятой простыми целочисленными сложениями, которые могут быть интегрированы в существующие модели ИИ без необходимости тонкой настройки. Этот инновационный подход продемонстрировал замечательную экономию энергии, достигая до 95% снижения потребления энергии для поэлементных тензорных умножений и 80% для вычислений скалярного произведения. Важно отметить, что эта энергоэффективность не компрометирует точность моделей ИИ, что является значительным достижением в поиске устойчивого ИИ.

Последствия L-Mul выходят за рамки простой экономии энергии; он улучшает производительность моделей ИИ в различных приложениях, включая трансформерные модели и большие языковые модели (LLM). В таких бенчмарках, как GSM8k и задачи визуального вопросно-ответного взаимодействия, L-Mul превзошел традиционные форматы с плавающей запятой, такие как FP8, демонстрируя свой потенциал эффективно обрабатывать сложные вычисления. Поскольку спрос на ИИ продолжает расти, L-Mul выделяется как ключевое решение, которое не только решает энергетический кризис, связанный с ИИ, но и прокладывает путь к более устойчивому будущему в развитии технологий.

Related News

io.net и NovaNet партнеры для улучшения верификации GPU с помощью zkGPU-ID cover
3 дня назад
io.net и NovaNet партнеры для улучшения верификации GPU с помощью zkGPU-ID
В значительном шаге к повышению безопасности и надежности в децентрализованных вычислительных сетях, io.net, децентрализованная сеть физической инфраструктуры (DePIN), специализирующаяся на кластерах GPU, сформировала партнерство с NovaNet, лидером в области доказательств с нулевым разглашением (ZKP). Это сотрудничество направлено на разработку революционного решения, известного как идентификация GPU с нулевым разглашением (zkGPU-ID), которое предоставит криптографические гарантии относительно подлинности и производительности ресурсов GPU. Используя передовые технологии ZKP от NovaNet, io.net сможет подтвердить, что GPU, используемые в его децентрализованной платформе, не только соответствуют, но и потенциально превосходят свои рекламируемые характеристики, тем самым повышая доверие пользователей и надежность ресурсов. Таусиф Ахмед, вице-президент по развитию бизнеса в io.net, подчеркнул важность этого партнерства, заявив, что оптимизация координации и верификации в обширной сети распределенных поставщиков GPU имеет решающее значение для создания децентрализованной вычислительной сети, готовой к предприятиям и без разрешений. Интеграция zkGPU-ID от NovaNet позволит io.net постоянно проверять и тестировать свои ресурсы GPU на глобальном уровне, обеспечивая уверенность клиентов в том, что они могут арендовать надежные GPU, которые соответствуют их специфическим потребностям. Эта инициатива представляет собой значительный шаг вперед в децентрализованной вычислительной инфраструктуре, направленной на устранение проблем, связанных с подлинностью ресурсов и производительностью. Более того, протокол zkGPU-ID использует технологию zkVM (нулевая виртуальная машина) от NovaNet, которая играет важную роль в создании и верификации криптографических доказательств характеристик GPU по более низким затратам. Уайат Бенно, технический соучредитель NovaNet, подчеркнул необходимость работы ZKP на различных устройствах и в различных контекстах для обеспечения конфиденциальности и локальной верифицируемости. zkEngine от NovaNet тщательно тестирует и идентифицирует GPU в платформе io.net, создавая ZKP, который гарантирует целостность GPU. Это партнерство устанавливает новый стандарт прозрачности, надежности и безопасности в децентрализованных вычислительных сетях GPU, что является важным шагом вперед в отрасли.
Stratos сотрудничает с MetaTrust Labs для повышения безопасности Web3 cover
4 дня назад
Stratos сотрудничает с MetaTrust Labs для повышения безопасности Web3
В значительном развитии экосистемы Web3 Stratos объявила о партнерстве с MetaTrust Labs, ведущим поставщиком инструментов безопасности AI для Web3 и услуг аудита кода. Это сотрудничество направлено на повышение безопасности и устойчивости приложений Web3 путем объединения передовых мер безопасности на основе AI с децентрализованными решениями хранения Stratos. Партнерство нацелено на создание надежной инфраструктуры, которая не только защищает данные, но и обеспечивает надежность и эффективность приложений Web3, что является важным аспектом как для разработчиков, так и для пользователей. MetaTrust Labs, которая была инкубирована в Наньянском технологическом университете в Сингапуре, признана за свой инновационный подход к безопасности Web3. Компания специализируется на разработке передовых решений AI, предназначенных для помощи разработчикам и заинтересованным сторонам в защите их приложений и смарт-контрактов. Этот акцент на безопасности является жизненно важным в быстро развивающемся цифровом ландшафте, где уязвимости могут привести к значительным рискам. Используя технологии AI, MetaTrust Labs стремится создать более безопасные и эффективные цифровые экосистемы, которые могут противостоять потенциальным угрозам. Stratos, известная своей приверженностью к децентрализованным инфраструктурным решениям, играет ключевую роль в этом партнерстве. Компания предоставляет децентрализованную инфраструктуру хранения, которая поддерживает высокую доступность, масштабируемость и устойчивость для платформ Web3. Интегрируя свои децентрализованные решения хранения с инструментами безопасности на основе AI от MetaTrust Labs, партнерство обещает предоставить беспрецедентный уровень защиты кода и данных в приложениях Web3. Это сотрудничество не только повышает уверенность в безопасности для разработчиков, но и способствует общей целостности пространства Web3, прокладывая путь к более безопасному цифровому будущему.
Догикоин сохраняет ликвидность на фоне рыночных изменений, Биттенсор сталкивается с проблемами cover
4 дня назад
Догикоин сохраняет ликвидность на фоне рыночных изменений, Биттенсор сталкивается с проблемами
В текущем криптовалютном ландшафте Догикоин (DOGE) продемонстрировал замечательную устойчивость, сохранив стабильную ликвидность, несмотря на рыночные колебания. После недавних выборов в США наблюдался значительный рост активности со стороны крупных держателей, или китов, с увеличением чистых потоков китов почти на 957%. Этот всплеск привел к тому, что объем транзакций вырос с примерно 45 миллионов до более чем 430 миллионов DOGE всего за один день. Хотя цена Догикоина на короткое время поднялась примерно на 10% в период выборов, она позже упала примерно на 6%, стабилизировавшись на немного более низком уровне. Тем не менее, его объем торгов остается высоким, превышая 3,8 миллиарда долларов, с рыночной капитализацией близкой к 29 миллиардам долларов, что подчеркивает его сильные позиции на рынке и продолжающийся интерес со стороны крупных инвесторов. С другой стороны, Биттенсор (TAO) сталкивается с проблемами, так как наблюдается снижение ликвидности, что вызывает беспокойство среди его инвесторов. С рыночной капитализацией около 3,7 миллиарда долларов и ежедневным объемом торгов примерно 165 миллионов долларов, сниженная торговая активность указывает на изменение вовлеченности инвесторов. В настоящее время в обращении находится около 7,4 миллиона токенов TAO из максимального объема в 21 миллион. Падение ликвидности может привести к увеличению волатильности цен, что делает важным для инвесторов внимательно следить за этими тенденциями. Продолжающееся снижение может повлиять на стоимость токена и его общую привлекательность для потенциальных инвесторов. В отличие от этого, IntelMarkets (INTL) становится многообещающей альтернативой на арене криптоторговли, предлагая уникальную торговую платформу на основе ИИ, построенную на современном блокчейне. В настоящее время находясь на 5 этапе своего предпродажи, IntelMarkets собрал около 2 миллионов долларов, продав почти 10 миллионов токенов по цене 0,045 Tether, которая должна увеличиться до примерно 0,054. Самообучающиеся боты платформы обрабатывают более 100 000 данных, позволяя трейдерам принимать обоснованные решения на основе данных в реальном времени. С ограниченным предложением токенов и передовыми технологиями IntelMarkets позиционирует себя как стратегическая платформа для инвесторов, стремящихся к стабильному росту и стабильности на волатильном рынке.
Falcon Mamba 7B: Прорыв в моделях ИИ без внимания cover
4 дня назад
Falcon Mamba 7B: Прорыв в моделях ИИ без внимания
Быстрая эволюция искусственного интеллекта (ИИ) значительно зависит от появления моделей без внимания, и Falcon Mamba 7B является ярким примером. Разработанная Институтом технологических инноваций (TII) в Абу-Даби, эта революционная модель отходит от традиционных архитектур на основе трансформеров, которые сильно полагаются на механизмы внимания. Вместо этого Falcon Mamba 7B использует модели состояния пространства (SSM), которые обеспечивают более быструю и экономичную по памяти инференцию, решая вычислительные задачи, связанные с задачами с длинным контекстом. Обучаясь на обширном наборе данных из 5,5 триллионов токенов, Falcon Mamba 7B позиционирует себя как конкурентоспособная альтернатива существующим моделям, таким как Gemma от Google и Phi от Microsoft. Архитектура Falcon Mamba 7B разработана для поддержания постоянных затрат на инференцию, независимо от длины входных данных, эффективно решая проблему квадратичного масштабирования, которая беспокоит модели трансформеров. Эта уникальная способность позволяет ей превосходить в приложениях, требующих обработки длинного контекста, таких как суммирование документов и автоматизация обслуживания клиентов. Хотя она продемонстрировала превосходные результаты в различных бенчмарках обработки естественного языка, она все еще сталкивается с ограничениями в задачах, требующих сложного понимания контекста. Тем не менее, ее эффективность по памяти и скорость делают ее привлекательным выбором для организаций, стремящихся оптимизировать свои решения ИИ. Последствия Falcon Mamba 7B выходят за рамки простых метрик производительности. Ее поддержка квантизации позволяет эффективно развертывать модель как на GPU, так и на CPU, что дополнительно увеличивает ее универсальность. По мере эволюции ландшафта ИИ успех Falcon Mamba 7B предполагает, что модели без внимания могут вскоре стать стандартом для многих приложений. С продолжающимися исследованиями и разработками эти модели могут потенциально превзойти традиционные архитектуры как по скорости, так и по точности, прокладывая путь для инновационных приложений в различных отраслях.
Соединяя строителей: мероприятия в Бангкоке, сосредоточенные на данных, ИИ и криптовалюте cover
5 дней назад
Соединяя строителей: мероприятия в Бангкоке, сосредоточенные на данных, ИИ и криптовалюте
В рамках яркого стремления к инновациям на пересечении данных, ИИ и криптовалюты группа строителей готовится взаимодействовать с сообществом в Бангкоке в этом месяце. Они будут присутствовать на нескольких ключевых мероприятиях, включая саммит разработчиков Filecoin FIL 11 ноября, Devcon с 12 по 15 ноября и День DePIN от Fluence 15 ноября. Эти встречи предназначены как для строителей, так и для операторов и новичков, предоставляя платформу для сетевого взаимодействия и сотрудничества в быстро развивающемся ландшафте Web3. Основное внимание на этих мероприятиях уделяется установлению связей между теми, кто интересуется децентрализованными технологиями. Участники могут ожидать обсуждения различных тем, таких как децентрализованное хранилище, проверяемые данные и управление идентичностью. Организаторы особенно заинтересованы в продвижении своей частной группы в Telegram, Proof of Data, которая служит совместным пространством для людей, решающих проблемы в экосистеме данных Web3. Эта инициатива направлена на создание сообщества, где участники могут делиться идеями и решениями, связанными с доступностью данных и синтетическими данными. Поскольку экосистема Web3 продолжает расти, такие мероприятия, как эти, имеют решающее значение для построения отношений и обмена знаниями. Объединяя разнообразных заинтересованных сторон, от опытных разработчиков до любопытных учащихся, встречи в Бангкоке обещают стать плавильным котлом идей и инноваций. Участников призывают связаться с командой на Дне DePIN для получения дополнительной информации и присоединиться к текущему обсуждению в сообществе Proof of Data, обеспечивая всем возможность внести свой вклад в будущее децентрализованных технологий.
CUDOS сотрудничает с ParallelAI для улучшения децентрализованного ИИ-вычисления cover
7 дней назад
CUDOS сотрудничает с ParallelAI для улучшения децентрализованного ИИ-вычисления
CUDOS, видный игрок в области устойчивых и децентрализованных облачных вычислений, недавно заключил стратегическое партнерство с ParallelAI, пионером в области параллельных вычислительных решений, адаптированных для искусственного интеллекта. Это сотрудничество направлено на объединение высокопроизводительных графических процессоров Ada Lovelace и Ampere от CUDOS с параллельным программным обеспечением Parahub от ParallelAI, что позволит создать децентрализованную среду для ИИ-вычислений, обещающую исключительную эффективность и масштабируемость. Используя децентрализованную инфраструктуру CUDOS, экосистема $PAI от ParallelAI получит доступ к надежным и экономически эффективным ресурсам GPU, что позволит ускорить рабочие нагрузки ИИ и оптимизировать использование GPU при минимизации операционных расходов. Время этого партнерства особенно значимо, так как CUDOS продолжает развивать недавнее слияние токенов с членами ASI Alliance, среди которых такие известные организации, как Fetch.ai, SingularityNET и Ocean Protocol. Это стратегическое сотрудничество еще больше укрепляет позицию CUDOS в признанной на мировом уровне децентрализованной сети ИИ. Предстоящие запуски ParallelAI, такие как язык программирования Parilix и автоматизированный трансформатор кода PACT, должны дополнить это партнерство, упростив программирование GPU и повысив доступность параллельной обработки для разработчиков, тем самым способствуя инновациям в секторе ИИ. Сотрудничество между CUDOS и ParallelAI символизирует взаимную преданность продвижению устойчивых и доступных решений для ИИ-вычислений. По мере продвижения интеграции их технологий это партнерство готово открыть новую эру децентрализованных высокопроизводительных вычислений, в конечном итоге переопределяя ландшафт искусственного интеллекта как для разработчиков, так и для предприятий. С возможностью ParallelAI повышать эффективность вычислений за счет значительного сокращения времени вычислений, синергия между этими двумя компаниями ожидается как способствующая множеству проектов на основе ИИ и крупномасштабным анализам данных.