Просмотры:0 Автор:Pедактор сайта Время публикации: 2026-05-12 Происхождение:Работает
В быстро развивающемся мире инфраструктуры центров обработки данных переход от воздушного охлаждения к жидкостному охлаждению больше не является будущей дорожной картой — это требование сегодняшнего дня. Благодаря тому, что серверные стойки AI превышают 40 кВт, а расширенные конфигурации нацелены на мощность от 100 до 120 кВт+, прямое охлаждение кристалла стало основой управления температурным режимом.
Однако по мере того, как в отрасли стандартизируется жидкостное охлаждение, возникла новая, более тонкая инженерная задача. Архитекторы оборудования обнаруживают, что не все охлаждающие пластины одинаковы. Архитектура, которая идеально работает с промышленным инвертором или стандартным процессором, может катастрофически выйти из строя при установке на ускоритель искусственного интеллекта следующего поколения. Это ставит перед инженерами центров обработки данных критический вопрос: в какой именно момент надежная стандартная жидкостная охлаждающая пластина перестает действовать как решение для охлаждения и начинает действовать как узкое место в системе?
В этом подробном инженерном руководстве рассматриваются архитектурные особенности пластин жидкостного охлаждения серверов искусственного интеллекта. Мы проанализируем физические ограничения традиционных процессов глубокой обработки, изучим уникальное тепловое поведение графических процессоров высокой плотности и обозначим критические пороговые значения, которые определяют, когда ваш центр обработки данных должен перейти на передовые технологии охлаждения микроструктур.
Как развивалось прямое охлаждение чипа в центрах обработки данных с искусственным интеллектом?
Каковы основные характеристики пластины для глубокой обработки с жидкостной холодной обработкой?
В какой момент традиционные холодные тарелки достигают своего физического предела?
Как потоковая архитектура ограничивает тепловую оптимизацию?
Глубокая обработка против микроканала графического процессора: что показывают характеристики?
Исторически сложилось так, что управление температурным режимом в центре обработки данных представляло собой бинарный подход: воздушное охлаждение или жидкостное охлаждение. Ранние внедрения охлаждения непосредственно на кристалл в стандартных корпоративных серверах (обычно ориентированных на многоядерные процессоры) использовали относительно простые конструкции холодных пластин. Цель была проста: устранить равномерную и предсказуемую тепловую нагрузку со стандартного полупроводникового контура, чтобы поддерживать температуру окружающей среды серверного корпуса в безопасных эксплуатационных пределах.
Сегодня ситуация резко изменилась. С развертыванием узлов обучения искусственного интеллекта, в которых размещены несколько сверхмощных графических процессоров (таких как масштабные архитектуры H100, B200 или GB200), тепловая плотность одной стойки увеличилась в геометрической прогрессии. Один сервер с несколькими графическими процессорами может легко превысить 10 кВт.
По этой причине жидкостное охлаждение центров обработки данных больше не является просто проблемой сантехники на уровне объекта; это микроскопическая задача кремниевого уровня. Разговор перешел от вопроса «нужна ли нам жидкость?» к вопросу «какой конкретный тип структуры жидкостного охлаждения требуется этому чипу?» По мере того, как чипы искусственного интеллекта становятся плотнее, сама холодная пластина превращается в основной ограничитель производительности. Если холодная пластина не может отводить тепло достаточно быстро, графический процессор запускает термическое регулирование, намеренно замедляя свою тактовую частоту, чтобы выжить. В центре обработки данных искусственного интеллекта, где время вычислений стоит тысячи долларов в час, дросселирование графического процессора является неприемлемой финансовой потерей.
Чтобы понять, почему возникает узкое место, мы должны изучить производственную базу используемых компонентов. Очень популярным термическим решением начального и среднего уровня является пластина с жидкостной холодной обработкой для глубокой обработки .
В соответствии с устоявшимися инженерными практиками, такими как те, которые были усовершенствованы Kingka, этот тип холодных пластин, обработанных на станках с ЧПУ, изготавливается с использованием высоконадежного субтрактивного процесса. Инженеры берут прочный монолитный блок из алюминия или меди и используют специальное сверлильное оборудование, чтобы просверлить глубокие параллельные отверстия прямо в металле. Эти внутренние каналы затем соединяются посредством поперечного сверления, образуя непрерывную петлю для жидкости, а внешние отверстия плотно закрываются прочными металлическими заглушками.
Преимущества этой архитектуры неоспоримы для конкретных приложений. Поскольку он имеет цельную металлическую конструкцию без паяных соединений и сварных швов, риск утечки охлаждающей жидкости чрезвычайно низок. Он обеспечивает превосходную структурную стабильность и очень экономически выгоден для масштабного производства. Для промышленных вычислительных узлов, стандартных процессоров, телекоммуникационного оборудования и систем управления аккумуляторами электромобилей (EV) пластина с глубокой механической обработкой является идеальным и надежным решением. Эти применения характеризуются относительно равномерным распределением тепла и средней температурной плотностью, что обеспечивает надежность блока с глубокими отверстиями.
Несмотря на свою надежность в промышленных условиях, пластины глубокой механической обработки обладают присущими им физическими ограничениями, определяемыми термодинамикой и геометрией. Гладкой цилиндрической форме просверленного канала не хватает расширенной площади внутренней поверхности, необходимой для мгновенного поглощения огромного количества концентрированной энергии.
При оценке систем охлаждения для кремния следующего поколения инженеры должны тщательно оценить конкретные ограничения выбранного ими метода производства. Чтобы правильно ориентироваться в проектировании системы, необходимо понимать [ предел теплового потока пластин с жидкостным охлаждением для глубокой обработки ]. Как правило, эти твердоблочные конструкции оптимизированы для обеспечения непрерывного теплового потока среднего уровня. Поскольку тепло должно проходить через цельный металлический блок и поступать в жидкость через относительно гладкие стенки каналов, их способность выдерживать экстремальные, локализованные мощности (часто превышающие сотни ватт на квадратный сантиметр) ограничена. Как только тепловой поток превышает скорость поглощения металла, происходит локальное тепловое насыщение, и пластина просто не может достаточно быстро передать тепло в жидкость.
Определяющей характеристикой современного графического процессора с искусственным интеллектом является то, что его тепловыделение совершенно неравномерно. Пакет высокопроизводительных графических процессоров обычно содержит различные компоненты, такие как основные вычислительные ядра и память с высокой пропускной способностью (HBM), расположенные на одной подложке. При больших нагрузках при обучении ИИ определенные логические ядра будут испытывать огромные мгновенные скачки мощности, создавая серьезные «горячие точки».
Эти «горячие точки» являются важнейшим параметром конструкции жидкостного охлаждения серверов искусственного интеллекта. Чтобы понять, почему традиционное охлаждение здесь не работает, технические покупатели должны выяснить [ почему холодные пластины глубокой обработки не справляются с охлаждением графического процессора с высокой плотностью ]. Фундаментальным вопросом является геометрическая жесткость. Глубокая обработка основана на использовании прямых, параллельных отверстий, которые обеспечивают «основанный на правилах» или равномерный путь охлаждения. Они предполагают, что тепло распределяется равномерно по блоку. Однако для «горячих точек» графического процессора требуются узконаправленные конструкции микроканалов с учетом «горячих точек», которые динамически распределяют большую площадь охлаждающей поверхности и жидкость непосредственно по самому горячему миллиметру кремния. Поскольку пластины с глубокой механической обработкой не могут иметь переменную плотность каналов или маршрутизацию, оптимизированную по топологии, они в конечном итоге переохлаждают неактивные области, оставляя критические горячие точки опасно горячими.
Узкое место сервера искусственного интеллекта связано не только с поглощением тепла; оно глубоко связано с гидродинамикой. Внутренняя архитектура охлаждающей пластины определяет, как охлаждающая жидкость взаимодействует с нагретым металлом, что, в свою очередь, влияет на насосную и коллекторную систему всей серверной стойки.
В пластине, просверленной пистолетом, жидкость движется параллельно источнику тепла вдоль гладких стенок. Это известно как «обходной поток». Хотя он отлично подходит для минимизации перепада давления, он неэффективен для разрушения стойкого теплового пограничного слоя над серьезной горячей точкой. Следовательно, инженеры вынуждены точно распознавать [ когда холодные пластины глубокой обработки достигают своих пределов ] при экстремальных нагрузках центра обработки данных. Попытка охладить чип искусственного интеллекта мощностью более 1000 Вт с помощью глубоко обработанной пластины обычно приводит к тому, что инженеры увеличивают скорость насоса, чтобы пропустить через каналы больше жидкости. Однако это приводит к резкому падению давления в серверной стойке до неприемлемого уровня, серьезно влияя на равномерность распределения потока и эффективность откачки, и все это без адекватного снижения температуры ядра чипа.
Холодные пластины с настоящим высоким тепловым потоком решают эту проблему за счет «струйного воздействия» и микроребристых структур. В усовершенствованной охлаждающей пластине графического процессора охлаждающая жидкость подается вертикально вниз на тысячи тонких, как бритва, медных микроребер, расположенных точно над горячей точкой. Это создает огромную турбулентность, резко отводя тепло и решая проблему температурного градиента, от которой страдают блоки, обработанные при глубокой обработке.
Чтобы наглядно проиллюстрировать, когда холодная пластина для глубокой обработки становится узким местом, мы должны сравнить ее с архитектурами, специально разработанными для эпохи искусственного интеллекта. В таблице ниже показаны критические различия, которые определяют границу между прямым охлаждением чипа начального уровня и передовыми решениями для центров обработки данных.
Инженерное измерение | Глубокая обработка жидкая холодная тарелка | Усовершенствованная микроканальная холодная пластина графического процессора |
Внутренняя структура канала | Симметричные, прямые, параллельные отверстия. | Асимметричные микроструктуры с оптимизированной топологией |
Механизм теплопередачи | Трубопроводная проводимость/обходной поток | Поверхностный обмен / столкновение струи |
Пропускная способность точки доступа | Умеренная (зависит от проводимости чистого металла) | Чрезвычайно высокий (целевая турбулентность жидкости) |
Сложность производства | От низкого до среднего (ЧПУ и сверление) | Высокая (зачистка, вакуумная пайка, моделирование CFD) |
Управление падением давления | Легко контролируется при более низких скоростях потока. | Требует сложной оптимизации коллектора |
Идеальный профиль применения | Процессоры, промышленные инверторы, телекоммуникации, EV BMS | Узлы AI с несколькими графическими процессорами (архитектура H100/B200/GB200) |
Пригодность центра обработки данных | Начальный уровень / Общие вычисления | Массовый искусственный интеллект и высокопроизводительные вычисления (HPC) |
Как показывают данные, глубокая механическая обработка является превосходной технологией в пределах своих возможностей. Однако в случае серверного узла мощностью более 3000 Вт, где локальные точки доступа обычно достигают 200 Вт/см⊃2;, холодная пластина с глубокой механической обработкой перестает быть решением проблемы теплоотвода и становится основным узким местом оборудования.
Мы достигли критической точки перелома в разработке аппаратного обеспечения центров обработки данных. Если мощность вашей стойки AI-сервера превышает 50 кВт, а энергопотребление вашего отдельного графического процессора достигает уровня от 700 Вт до 1000 Вт и выше, холодная пластина больше не является просто пассивным радиатором — это упреждающий контроль производительности.
Использование традиционных холодных пластин, обработанных на станке с ЧПУ, с параллельными просверленными отверстиями для этих современных чипов неизбежно приведет к неравномерному охлаждению кристалла, опасным температурным градиентам и дорогостоящему тепловому дросселированию. Узкое место в системе сместилось с «есть ли у нас течь жидкости?» на «насколько равномерно и агрессивно жидкость подавляет локализованные горячие точки?»
Чтобы раскрыть всю вычислительную мощность ускорителей искусственного интеллекта следующего поколения, разработчики оборудования должны обновить свою тепловую архитектуру. Будущее пластин жидкостного охлаждения серверов AI связано с микроканальными охлаждающими пластинами, меднопаяными конструкциями с высоким тепловым потоком и оптимизированными с помощью CFD коллекторными системами.
В Kingka мы понимаем этот критический переход. В то время как мы производим ведущие в отрасли пластины глубокой механической обработки для промышленности и электромобилей, наше подразделение теплотехники полностью оснащено для того, чтобы помочь разработчикам аппаратного обеспечения искусственного интеллекта совершить переход к передовым микроканальным архитектурам и архитектурам прямого подключения к кристаллу. Если ваше нынешнее решение жидкостного охлаждения ограничивает вашу вычислительную мощность, пришло время отойти от стандартного блочного охлаждения. Свяжитесь с нашей командой инженеров сегодня, чтобы разработать тепловое решение высокой плотности с учетом точек доступа, которое обеспечит работу вашего центра обработки данных с максимальной производительностью.
Вопрос 1. Что именно делает графический процессор «высокоплотным» по сравнению со стандартным процессором?
О: Графический процессор высокой плотности объединяет тысячи процессорных ядер и расширенную память (например, HBM) на очень небольшом физическом пространстве. Такая концентрация означает, что он генерирует гораздо больше тепла на квадратный сантиметр (тепловой поток), чем стандартный процессор, создавая серьезные горячие точки, требующие узкоспециализированного охлаждения.
Вопрос 2: Почему я не могу просто использовать более толстую холодную пластину с глубокой механической обработкой для более горячего графического процессора?
Ответ: Утолщение металлического блока фактически увеличивает термическое сопротивление. Для прохождения тепла от стружки через толстый металл в жидкость требуется больше времени. Усовершенствованное охлаждение графического процессора основано на подаче жидкости как можно ближе к кремниевому кристаллу, обычно с помощью ультратонких медных микроребер, а не толстых металлических блоков.
Вопрос 3. Что такое «тепловое регулирование» на сервере искусственного интеллекта?
О: Термическое дросселирование — это механизм самосохранения, встроенный в микрочипы. Если холодная пластина не может отвести тепло достаточно быстро и чип достигает максимально безопасной температуры, процессор автоматически снижает скорость вычислений, чтобы выделять меньше тепла. При обучении ИИ это резко увеличивает время вычислений и эксплуатационные затраты.
Вопрос 4: Можно ли использовать алюминиевую холодную пластину в центрах обработки данных искусственного интеллекта?
О: В целом нет. Хотя алюминий дешев и его легко обрабатывать на станках с ЧПУ, его теплопроводность (около 200 Вт/м·К) слишком мала для экстремальных горячих точек AI-графического процессора. В пластинах жидкостного охлаждения центров обработки данных для искусственного интеллекта почти исключительно используется медь (около 400 Вт/м·К) из-за ее значительно превосходящей способности поглощать и распределять концентрированное тепло.
Вопрос 5: Что такое «струйное столкновение» при жидкостном охлаждении?
Ответ: Вместо того, чтобы жидкость плавно текла по поверхности, струя выталкивает охлаждающую жидкость вниз через ограничительную пластину (струйную пластину), ускоряя жидкость так, что она резко врезается в микроребра непосредственно над горячей точкой чипа. Эта турбулентность разрушает тепловой пограничный слой, максимизируя отвод тепла.
Вопрос 6. Влияет ли переход на микроканальную охлаждающую пластину на остальную часть серверной стойки?
А: Да. Микроканальные пластины имеют тысячи крошечных ребер, которые создают более высокий перепад давления (сопротивление потоку), чем глубокие отверстия. Для модернизации необходимо обеспечить, чтобы блок распределения охлаждающей жидкости (CDU) и система коллекторов вашей стойки имели достаточно мощные насосы, чтобы проталкивать жидкость через эти очень ограниченные и плотные каналы.
Вопрос 7: Устарела ли технология глубокой обработки?
О: Абсолютно нет. Глубокая обработка остается одним из самых надежных, экономичных и герметичных термических решений в мире для применений с равномерным выделением тепла среднего уровня. Он доминирует в силовой электронике электромобилей, телекоммуникациях и промышленных инверторах; это просто неподходящий инструмент для кремния искусственного интеллекта чрезвычайной плотности.