Kritische Anforderungen an die Energieeffizienz von Rechenzentren
Der Aufstieg der KI macht die Rechenleistung im Rechenzentrum zu einer hochwertigen, energieintensiven Ressource. Die Produktteams müssen für Effizienz, Dichte und Zuverlässigkeit sorgen und gleichzeitig die sprunghafte Nachfrage bewältigen sowie infrastrukturelle, behördliche und politische Beschränkungen berücksichtigen. Um dieses Gleichgewicht zu erreichen, sind Innovationen bei der schnellen, effizienten Energieumwandlung und eine abgestufte, hardwaregetaktete Überwachung erforderlich, um sowohl kritische Niederspannungsschienen als auch Hilfsschienen auf Systemebene zu schützen.
Moderne Rechenzentren, insbesondere solche, die auf KI ausgerichtet sind, werden zunehmend nach der Leistungsdichte und der Gesamtenergiekapazität und nicht nur nach der Anzahl der Server konzipiert. Wo früher Server die Haupteinheit der Planung waren, sind moderne Rechenzentren heute nach Megawatt Leistung und Kühlung organisiert und eher für ganze Reihen oder Pods von Racks als für einzelne Maschinen ausgelegt.
KI-optimierte Racks verbrauchen oft 30 kW oder mehr, ein Vielfaches der 5 bis 15 kW, die für herkömmliche Server-Racks typisch sind, so dass der Spitzenverbrauch eines einzelnen Racks dem eines kleinen Wohnviertels entspricht. Der Betrieb in dieser Umgebung erfordert Anwendungen, die in der Lage sind, die knapp bemessene Energieversorgung zu verwalten und die Systeme auch bei plötzlichen Spannungsspitzen stabil zu halten. Komponenten von Texas Instruments zeigen, wie moderne Designs diese neuen Anforderungen an Leistung und Zuverlässigkeit erfüllen können.
Vorausschauende Berücksichtigung von Einschränkungen
Das bedeutet, dass Entwickler nicht mehr davon ausgehen können, dass sich Funktionen automatisch skalieren lassen. Jede Interaktion, jede Berechnung und jede datenintensive Erfahrung hat jetzt einen spürbaren Einfluss auf die zugrunde liegenden Systeme. Funktionen, die große, plötzliche Arbeitslasten auslösen, können zu Latenzzeiten führen, Drosselungen verursachen oder Skalierungskompromisse an anderer Stelle im System erfordern.
Die effektivsten Entwürfe antizipieren Einschränkungen, anstatt sie zu ignorieren, und liefern einen Mehrwert, während sie unter Druck reaktionsfähig bleiben und jedes Bit an Rechenleistung ausnutzen. Entwickler müssen zwischen Geschwindigkeit, Funktionalität und Effizienz abwägen und dabei das Benutzererlebnis mit den physikalischen Grenzen von Rechenleistung und Energie in Einklang bringen.
Die Integration von Effizienz, Präzision und Ausfallsicherheit in die Hardware ist der Schlüssel zur Entwicklung von Rechenzentrumsanwendungen, die einen Mehrwert bieten, ohne die Systeme zu überlasten. Anwendungen müssen auch unter Druck reaktionsschnell bleiben und jedes Watt an Rechenleistung ausnutzen. Das fängt bei Komponenten an, die den Strom verwalten, die Spannung überwachen und die Leistung bei plötzlichen Überspannungen sichern.
Im Folgenden wird dargestellt, wie die Komponenten von TI diese Anwendungen unterstützen können.
Die Umwandlungsschicht
Die Galliumnitrid(GaN)-Technologie wird immer wichtiger für die Optimierung der Effizienz von Rechenzentren. KI-Server, die von NVIDIA-Grafikprozessoren (GPUs) angetrieben werden, verbrauchen große Mengen an Energie, die schnell und präzise heruntergewandelt werden muss. Die Integration eines Highspeed-Gatetreibers mit einem GaN-Feldeffekttransistor (FET) ermöglicht höhere Schaltfrequenzen und geringere Schaltverluste im Vergleich zu herkömmlichen Siliziumlösungen. Dadurch wird der Wirkungsgrad der Stromumwandlung sowohl auf der Leiterplatten- als auch auf der Rack-Ebene verbessert, was zu weniger Energieverlusten durch Abwärme, geringerem Kühlungsbedarf und kompakteren Stromversorgungsschaltungen führt. Rechenzentren profitieren von einer höheren Rechendichte und einer besseren Gesamtenergieeffizienz.
Der LMG3100R017VBER von TI (Abbildung 1) ist ein 100V-GaN-FET mit einem integrierten Hochfrequenz-Gatetreiber in einem kompakten Gehäuse. Er kombiniert den GaN-FET und den Treiber, einschließlich eines internen High-Side-Pegelwandlers und einer Bootstrap-Schaltung, so dass zwei Bauelemente eine Halbbrücke bilden können, ohne dass ein externer Pegelwandler erforderlich ist.
Abbildung 1: Der LMG3100R017VBER ist ein 1,7 mΩ GaN-FET für 100 V mit integriertem Gatetreiber. (Bildquelle: Texas Instruments)
Systemüberwachung
GaN-Bauelemente schalten extrem schnell und arbeiten mit hohen Spannungen. Schnelle, starke Schwankungen, wie sie bei Servern in Rechenzentren mit hoher Dichte üblich sind, können Spannungseinbrüche oder -spitzen verursachen, die zu fehlerhaftem Betrieb, erhöhter Belastung von Grafikprozessoren und anderen Komponenten sowie zu potenziellen Ausfallzeiten führen. Ohne angemessene Überwachung könnte eine GaN-FET-Leistungsstufe versuchen zu schalten, wenn die Spannung außerhalb des sicheren Bereichs liegt.
Während kritische Hochspannungsschienen eine schnell reagierende Überwachung benötigen, erfordern Hilfsschienen eine umfassendere Überwachung und Sequenzierung der Logik des Stromversorgungssystems, der I/O und der Kühlkreisläufe, um die Stabilität des Gesamtsystems zu gewährleisten.
Die Überwachungs-ICs der Serie TPS3760 von TI (Abbildung 2) überwachen eine einzelne Schiene mit hoher Spannung mit einer hardwaregetakteten Reaktion und minimalem Overhead. Während der Hersteller Modelle für Automobilanwendungen anbietet, können Entwickler, die auf Anwendungen in Rechenzentren abzielen, kommerzielle Standardversionen wie den TPS3760A015DYYR wählen. Diese Geräte verwenden interne Präzisionsspannungskomparatoren, um die Schienenspannung kontinuierlich mit einem festgelegten Schwellenwert zu vergleichen und ein Reset-Signal auszulösen, wenn die Spannung außerhalb des Bereichs liegt.
Abbildung 2: TPS3760-Bausteine sind 65V-Über-/Unterspannungsmonitore mit Sense-Eingang, extrem niedrigem Ruhestrom und programmierbarer Verzögerung. (Bildquelle: Texas Instruments)
Die Familie TPS389006 von TI bietet eine schnelle und präzise Überwachung von Niederspannungsleitungen, die GPUs, CPUs und Speicher versorgen. Die Bausteine TPS389006007RTER (Abbildung 3) zum Beispiel überwachen diese Schienen in Echtzeit und setzen sofort ein Reset-Signal ab, wenn die Spannung von den engen Toleranzen abweicht. In der Nähe des Lastpunkts platziert, schützen sie empfindliche Hochstromgeräte vor transienten Fehlern und gewährleisten einen stabilen Betrieb bei schnellen Lastwechseln.
Abbildung 3: TPS389600-Bauteile wie der TPS389006007RTER bieten eine hochpräzise, mehrkanalige Spannungsüberwachung für Systeme, die mit Niederspannungsversorgungsschienen arbeiten und enge Toleranzen bei der Versorgung aufweisen. (Bildquelle: Texas Instruments)
Die beiden Arten von Supervisor-ICs ergänzen GaN-FETs, indem sie Sequenzierung auf Systemebene mit schnellem Lastpunktschutz in einem abgestuften Überwachungsschema kombinieren: Die TPS3760-Bausteine überwachen höhere Spannungsschienen mit hardwaregetaktetem Reset, während die TPS389006-Bausteine kritische Niederspannungsschienen mit geringer Latenz überwachen und so einen sicheren und zuverlässigen Betrieb unter dynamischen Lastbedingungen gewährleisten.
Fazit
Highspeed-GaN-Leistungsstufen wie die LMG3100R017VBER von TI bieten eine kompakte, verlustarme Leistungswandlung mit sicherer High-Side-Schaltung. Supervisor-ICs wie der TPS389006 und der TPS3760 ermöglichen eine abgestufte, hardwaregetaktete Überwachung von kritischen Niederspannungsschienen bis hin zu Systemschienen mit höherer Spannung und gewährleisten so eine ordnungsgemäße Sequenzierung und schnelle Fehlerreaktion. Durch die Kombination von schneller, effizienter Energieumwandlung und mehrschichtiger Überwachung können Entwickler die Systemdichte erhöhen, Wärme- und Energieverschwendung reduzieren und die Leistung auch bei schwankender Arbeitslast stabil halten.
Have questions or comments? Continue the conversation on TechForum, Digi-Key's online community and technical resource.
Visit TechForum
