Casa - Blogues - Detalhes

QSFP-DD vs OSFP: guia de seleção do transceptor 400G

DR:QSFP-DD e OSFP são os dois principais formatos de transceptor 400G, mas resolvem problemas diferentes. QSFP-DD oferece compatibilidade retroativa com QSFP28 e maior densidade de porta, tornando-o o melhor caminho de atualização. OSFP oferece mais espaço térmico para óptica coerente de alta-potência e clusters de IA. Este guia aborda especificações, caminhos de migração, custo total de propriedade, etapas de implantação e solução de problemas para que você possa escolher com confiança.

Escolher entre QSFP-DD, QSFP28 e OSFP pode parecer um pequeno detalhe técnico. Não é. Essa decisão molda toda a sua arquitetura de rede, seu futuro caminho de atualização e seus gastos-de longo prazo. Escolha o formato QSFP-DD vs OSFP errado e você poderá enfrentar ciclos caros de destruição-e-de substituição ou ativos ociosos no valor de centenas de milhares de dólares.
À medida que os data centers avançam em direção a 400G, 800G e além, a questão do fator de forma continua surgindo. Você deveria seguir o conhecido ecossistema QSFP? Aposte-no OSFP para obter desempenho máximo? Ou seguir o caminho do meio com a compatibilidade retroativa do QSFP-DD?
NoCOBTEL1, passamos mais de 20 anos fabricandotransceptores ópticos, Patch cords MPO 2e chips ópticos-de alta velocidade. Ajudamos empresas da Fortune 500 a tomar exatamente essa decisão. Este guia fornece tudo o que você precisa: comparações de especificações, estratégias de migração, números reais de custos, instruções de implantação passo{4}}a-passo e estruturas de solução de problemas.

Quick Reference: QSFP-DD vs QSFP28 vs OSFP at a Glance

Referência rápida: QSFP-DD vs QSFP28 vs OSFP em resumo

Antes de nos aprofundarmos, aqui está a comparação lado a lado-a-que mais importa:
Especificação
QSFP28
QSFP-DD
OSFP
Velocidade máxima
100G
400G/800G
400G/800G/1.6T
Faixas Elétricas
4×25G
8×50G/100G
8×50G/100G
Largura
18,35mm
18,35mm
22,58mm
Potência máxima
~6W
~15W
~25W
Compatibilidade com versões anteriores
QSFP+
QSFP+/28/56
Nenhum
Densidade da porta 1RU
36 portas
36 portas
32 portas
Melhor para
Redes 100G existentes
Migração suave para 400G
Novas compilações de IA/HPC
 
QSFP28 é o carro-chefe de hoje. QSFP-DD é o caminho de atualização que protege seu investimento existente. OSFP é a opção de alto-desempenho desenvolvida para implantações novas. Escolha errado e você gastará demais ou ficará encurralado.

O que é QSFP28 e onde ele está hoje?

QSFP28 (Quad Small Form-factor Pluggable 28) é o formato padrão do transceptor 100G. Ele usa quatro pistas elétricas NRZ de 25 G para fornecer largura de banda total de 100 Gbps em um pacote-de 18,35 mm de largura com consumo de energia de até 6 W. Desde 2016, tem sido a espinha dorsal das redes empresariais e de data centers em nuvem.
Recursos principais:
4 × pistas elétricas 25G NRZ
Largura de 18,35 mm (igual a QSFP+ e QSFP-DD)
Consumo máximo de energia de aproximadamente 6W
Ecossistema maduro com amplo suporte de fornecedores
O QSFP28 domina os atuais data centers corporativos e em nuvem. Se você opera uma rede 100G hoje, é quase certo que você está usandoMódulos QSFP28. A questão não é substituí-los. É quando e como atualizar.
O formato QSFP283atinge o máximo de 100G sem caminho de atualização. Você pode adicionar mais portas, mas não pode aumentar a velocidade por meio de um único módulo. Esse teto é o que impulsiona a mudança para QSFP-DD ou OSFP.

O que é QSFP-DD e por que ele é o caminho-de atualização ideal?

QSFP-DD (dupla densidade) duplica as faixas elétricas para oito, mantendo exatamente a mesma largura de 18,35 mm do QSFP28. Ele suporta velocidades de 400G (8×50G) e 800G (8×100G) e é compatível com versões anteriores de módulos QSFP28. Você pode implantar switches QSFP{11}}DD hoje, continuar usando sua óptica 100G existente e fazer upgrade para 400G trocando os módulos quando estiver pronto.
O nome "Dupla Densidade" refere-se à interface elétrica, não ao tamanho físico. QSFP-DD consegue isso adicionando uma segunda linha de pinos elétricos em um conector um pouco mais profundo. Do lado de fora, umMódulo QSFP-DD 2parece quase idêntico a um QSFP28.
Recursos principais:
8× pistas elétricas 50G/100G PAM4
Mesma largura de 18,35 mm do QSFP28
Suporta 400G (8×50G) e 800G (8×100G)
Compatível com versões anteriores de módulos QSFP28
A vantagem da compatibilidade com versões anteriores é enorme. Você pode implantar switches QSFP{1}}DD agora, executar seus módulos QSFP{2}}G existentes nessas portas e atualizar links individuais para 400G conforme a demanda por largura de banda aumenta. Sem ativos ociosos. Sem atualização de empilhadeira.O QSFP-DD MSA 4projetou essa compatibilidade desde o início.

O que é OSFP e quando você deve escolhê-lo?

OSFP (Octal Small Form{0}}factor Pluggable) é um fator de forma-de alto desempenho-propositadamente desenvolvido. Ele tem 22,58 mm de largura (23% mais largo que o QSFP-DD), com suporte para dissipador de calor integrado e capacidade de energia de até 25 W. OSFP foi projetado para clusters de treinamento de IA, óptica coerente de longo-curso e futuros módulos 1.6T. Ele não é compatível com nenhum módulo da família-QSFP.
OSFP adotou uma abordagem de design diferente. Em vez de manter a compatibilidade com versões anteriores, o OSFP MSA5priorizou o espaço térmico e a proteção-para o futuro.
Recursos principais:
8× pistas elétricas 50G/100G PAM4
Largura de 22,58 mm (23% mais larga que QSFP-DD)
Potência máxima de até 25W
Compatibilidade zero com módulos da família-QSFP
OSFP brilha onde o espaço térmico é mais importante. Clusters de treinamento de IA executando interconexões de GPU de alta-potência, sistemas ópticos ZR+ coerentes de longa distância e futurosMódulos OSFP 800GTodos os módulos /1.6T se beneficiam do espaço extra e da capacidade de refrigeração. Se você estiver construindo uma nova infraestrutura sem nenhum equipamento legado QSFP28, o OSFP merece séria consideração.

Como a compatibilidade com versões anteriores realmente funciona?

A compatibilidade com versões anteriores é unidirecional-e não bidirecional-. Uma porta QSFP-DD aceita módulos QSFP28, mas uma porta QSFP28 não pode aceitar módulos QSFP-DD. Nenhum adaptador pode reverter isso. OSFP é completamente isolado da família QSFP, com diferentes contagens de pinos, larguras e mecanismos de trava.
Esta é a parte mais confusa da comparação QSFP-DD vs OSFP. Vamos esclarecer isso.

QSFP28 vs QSFP-DD port compatibility guide

Matriz de Compatibilidade

Tipo de porta
Módulo QSFP28
Módulo-DD QSFP
Módulo OSFP
Porta QSFP28
✅ Serve
❌ Muito profundo
❌ Muito largo
Porta QSFP-DD
✅ Serve
✅ Serve
❌ Muito largo
Porta OSFP
❌ Incompatibilidade de trava
❌ Incompatibilidade de trava
✅ Serve
 

Por que a compatibilidade{0}}unidirecional funciona

As portas QSFP-DD aceitam módulos QSFP28 porque as dimensões físicas estão alinhadas. O slot QSFP-DD é mais profundo para acomodar pinos elétricos extras. Um módulo QSFP28 simplesmente fica mais raso no slot e os sinais elétricos são compatíveis.
O inverso não funciona por dois motivos:
Incompatibilidade física:Os módulos QSFP-DD são mais profundos que os slots QSFP28. Eles não vão caber.
Incompatibilidade elétrica:QSFP-DD precisa de 8 pistas. QSFP28 fornece apenas 4. Mesmo que você pudesse forçá-lo, não funcionaria.

OSFP: Completamente Isolado

OSFP usa um conector de 60 pinos com uma pinagem diferente, uma largura de 22,58 mm que não cabe em slots QSFP e um design de trava diferente. É isolado eletricamente e mecanicamente da família QSFP.
Existem módulos adaptadores QSFP28-para OSFP, mas eles adicionam custo, complexidade e pontos de falha. Eles funcionam para algumas conexões legadas. Não são uma estratégia de migração.

Comparação física e de desempenho

Dimensões do fator de forma

Especificações
QSFP28
QSFP-DD
OSFP
Largura
18,35mm
18,35mm
22,58mm
Altura
8,5mm
8,5mm
13,0mm
Profundidade
~30mm
~35mm
~40mm
Volume
~4,7cm³
~5,4cm³
~11,8cm³
 
A diferença de largura entre QSFP{0}}DD e OSFP afeta diretamente a densidade da porta. Um switch de 1RU acomoda 36 portas QSFP-DD, mas apenas 32 portas OSFP. Implante 100 switches e o OSFP oferece 400 portas a menos ou você precisa de 12 switches extras para corresponder à capacidade.

Diferenças de potência e térmicas

O consumo de energia aumenta com velocidade e complexidade:
Tipo de módulo
QSFP28
QSFP-DD
OSFP
SR (curto alcance)
3-4W
6-8W
6-8W
LR (longo alcance)
4-5W
12-15W
12-15W
ZR (coerente)
N/A
15-20W
15-25W
Potência máxima suportada
~6W
~15W
~25W
 
QSFP-DD lida com módulos 400G padrão sem problemas. Mas os módulos coerentes ZR de alta-potência o aproximam do limite térmico. O dissipador de calor integrado e o maior volume do OSFP proporcionam espaço confortável para módulos acima de 20W.

QSFP-DD handles standard 400G modules without issues. But high-power ZR coherent modules push it close to its thermal ceiling. OSFP's integrated heatsink and larger volume provide comfortable headroom for modules above 20W.

Roteiro de velocidade

QSFP28:Atinge o máximo em 100G. Nenhum caminho de atualização além de adicionar portas.
QSFP-DD:Atualmente suporta 400G. Com QSFP-DD800, ele atinge 800G usando100G-por{2}}sinalização elétrica por pista. 1.6T é teoricamente possível, mas termicamente desafiador.
OSFP:Suporta 400G e 800G hoje. É o formato preferido para módulos 1.6T2noRoteiro da indústria da Aliança Ethernet.

Como você migra de QSFP28 para 400G?

Para a maioria das organizações, o caminho recomendado é QSFP28 para QSFP-DD. Implante switches QSFP-DD, mantenha seus módulos QSFP28 em execução e atualize os links de backbone para 400G primeiro. Uma migração típica leva de 12 a 24 meses e pode economizar mais de US$ 340.000 em comparação com uma substituição completa do equipamento.
Quando usar:Você possui módulos QSFP28 existentes que valem a pena preservar.
Passos:
Implante switches QSFP-DD enquanto continua usando módulos QSFP28
Atualize links de backbone de{0}}alta largura de banda para 400G QSFP-DD primeiro
Atualize gradualmente as conexões Top{0}}do-Rack (ToR) à medida que os servidores recebem novas NICs
Linha do tempo:12 a 24 meses para migração completa
Vantagem de custo:Você preserva os ativos ópticos existentes, paga zero custos de adaptador e distribui as despesas de capital pelos ciclos orçamentários.
Exemplo-real:Uma equipe de operações de serviços financeiros manteve 340 mil salvos.

Caminho 2: QSFP28 → OSFP (raramente usado)

Quando usar:Você precisa de módulos ZR+ de alta-potência e tem um inventário óptico existente mínimo.
Passos:
Substitua todos os módulos ópticos
Implante adaptadores QSFP28-para OSFP para conexões legadas (400 cada)
Toda a nova capacidade usa OSFP
Linha do tempo:Transferência imediata; nenhuma migração faseada é possível
Realidade de custos:Substituição completa do módulo mais 400 por conexão legada para adaptadores.

QSFP-DD vs OSFP: novo guia de seleção de build

Escolha QSFP-DD Quando:

Construindo data centers corporativos ou em nuvem
Executando cargas de trabalho mistas
Planejando a integração futura com a infraestrutura existente
A potência-por módulo permanece abaixo de 15 W

Escolha OSFP quando:

Construindo clusters de treinamento de IA
DCI{0}}de longa distância que exige módulos coerentes ZR+
Sem requisitos de compatibilidade legados
Precisa de espaço térmico máximo para módulos futuros

Fluxograma de Seleção

Etapa 1:Você tem infraestrutura QSFP28 existente?
Sim→ Escolha QSFP-DD (o valor de compatibilidade com versões anteriores é muito alto para ser ignorado). Feito.
Não→ Vá para a Etapa 2.
Etapa 2:Você precisa de óptica coerente ZR+ ou 1.6T em um futuro próximo?
Sim→ Escolha OSFP (o espaço térmico é essencial). Feito.
Não→ Escolha QSFP-DD (ecossistema mais amplo, maior densidade de porta). Feito.

Como realmente é o custo total de propriedade?

Em um data center de 100-racks migrando 2.000 portas de 100G para 400G, o QSFP-DD economiza aproximadamente US$ 660.000 em três anos em comparação ao OSFP. A economia vem da reutilização de 60% da óptica QSFP28 existente, da necessidade de 12% menos switches devido à maior densidade de portas e da eliminação de custos com adaptadores.

Preço do módulo

Os preços dos módulos são comparáveis ​​em todos os formatos:
Tipo de módulo QSFP28 QSFP-DD OSFP
RS (100G/400G) $200-500 $1,400-2,500 $1,400-2,500
LR (100G/400G) $400-800 $2,500-4,000 $2,500-4,000
ZR (coerente) N/A $8,000-15,000 $8,000-15,000
 
O preço não é determinado pelo formato. É orientado por volume, fornecedor e especificações.

Fatores de custo de infraestrutura

Custos de troca:Os switches QSFP-DD custam 400 menos por porta do que OSFP, graças aos maiores volumes de remessa e aos designs térmicos mais simples.
Energia e refrigeração:Os módulos OSFP consomem um pouco mais de energia em média. Ao longo de três anos, isso acrescenta 100 por troca nos custos de eletricidade.
Custos de migração:A compatibilidade com versões anteriores do QSFP-DD significa nenhum gasto com adaptador. OSFP requer adaptadores (400 por porta) ou substituição completa do módulo.

Estudo de caso de TCO: data center com 100 racks

Cenário:2.000 portas migrando de 100G para 400G.
Abordagem QSFP-DD:
Reutilize 60% da óptica QSFP28, economizando US$ 480.000
Custo zero do adaptador
Maior densidade de portas significa 12% menos switches, economizando US$ 180.000
Vantagem de TCO de três{0}}anos: aproximadamente US$ 660.000
Abordagem OSFP:
Substituição completa do módulo: US$ 1.200.000
Adaptadores de conexão legados: US$ 160.000
Mais switches necessários para igual capacidade: +$180.000
Prêmio TCO de três{0}}anos: aproximadamente US$ 1.540.000
Para construções greenfield sem módulos existentes, a lacuna diminui. Mas o QSFP-DD ainda ganha em custo de switch e densidade de porta.

Cenários reais-de implantação de 400G no mundo

Cenário 1: atualização do data center empresarial

Situação:Empresa-de médio porte com infraestrutura 100G de 5-anos e 200 módulos QSFP28 em serviço.
Precisar:Atualize o backbone para 400G, mantendo o ToR em 100G durante a transição.
Decisão:QSFP-DD.
Resultado:Migração tranquila de 18 meses sem interrupção dos negócios. Os módulos legados foram desativados naturalmente à medida que os servidores eram atualizados. Economizou US$ 300.000 em comparação com a substituição completa do equipamento. Orçamento distribuído por ciclos trimestrais.

Cenário 2: Novo Cluster de Treinamento de IA

Situação:Startup de IA construindo seu primeiro cluster de GPU. Nenhuma infraestrutura existente.
Precisar:Conexão direta-de 400 G por GPU. A sincronização do modelo-entre campus requer óptica coerente ZR+.
Decisão:OSFP.
Por que:Não é necessária compatibilidade herdada. Os módulos ZR+ de 22 W requerem espaço térmico do OSFP. O roteiro futuro de 800G/1.6T se alinha com OSFP.
Resultado:Switches OSFP de 64 portas implantados. Os módulos ZR+ funcionaram dentro das especificações térmicas de 22W. Caminho de atualização claro para 800G e além.

Cenário 3: implantação do hiperescalador em várias-regiões

Situação:Grande provedor de nuvem em expansão para novas regiões. As instalações existentes usam QSFP28/QSFP-DD.
Precisar:Padronize novas construções enquanto mantém os sites existentes.
Decisão:OSFP apenas para novas regiões.
Por que:Novas construções não têm restrições de legado. Nova capacidade padronizada em OSFP. As instalações existentes permanecem em QSFP-DD.
Resultado:Gerenciamento-padrão duplo por meio de compras padronizadas. Novas regiões usam OSFP, as instalações existentes mantêm QSFP-DD. Cadeia de fornecimento simplificada para nova capacidade.

Tutorial de implantação passo a passo do 400G OSFP--

400G OSFP Step-by-Step Deployment Tutorial

Acertar no OSFP 400G requer atenção a detalhes que as folhas de dados nem sempre destacam. Aqui está o processo completo, do planejamento à produção.

Planejamento pré{0}}da implantação

Verificação da realidade do orçamento de energia

As planilhas de dados do fornecedor listam a potência do módulo OSFP de 400G a 12-15W. O poder de produção no mundo real é maior. Em testes de produção, módulos individuais consomem cerca de 15-20W. Módulos ZR/ZR+ coerentes atingem 18-23W.
Para um switch OSFP 400G de 32 portas totalmente carregado:
Estimativa conservadora:32 portas × 15W × 2 (ambas as extremidades)=960W apenas para óptica
Estimativa realista:32 portas × 18W × 2=1,152W
Adicionar alimentação ASIC do switch(~300-400W para switches 400G)
Total por switch: 1,300-1,550W
Verifique a distribuição de energia e a capacidade de resfriamento do seu gabinete antes de comprar o hardware. Vimos equipes de data centers pularem cálculos térmicos e enfrentarem problemas de limitação após a{1}}implantação, precisando, em última análise, defletores de fluxo de ar e espaçamento de gabinete maior para estabilizar.

Verificação do dissipador de calor: parte superior plana- versus parte superior com aletas-

OSFP-400G-DR4 Comparison: Flat-Top vs Finned-Top

Este é o detalhe que atrasou vários-projetos do mundo real. 400. Os módulos G OSFP vêm em duas variantes de dissipador de calor físico:
Plataforma
Tipo de dissipador de calor
Notas
A maioria dos switches Arista
Fincado-superior
Switches padrão de data center
A maioria dos Cisco Nexus 9000
Fincado-superior
-
Switches NVIDIA Quantum-2
Fincado-superior
-
Placas de rede NVIDIA ConnectX-7
Parte superior-plana
O formato da NIC exige isso
DPUs NVIDIA BlueField-3
Parte superior-plana
-
 
Ao conectar switches diretamente às NICs do servidor, cada extremidade pode precisar de um tipo de dissipador de calor diferente. Confirme e faça o pedido corretamente antes da instalação. Modificações em campo anulam garantias e podem causar danos ao equipamento.

Avaliação de infraestrutura de fibra

Confirme se sua fibra existente suporta 400G:
SR8 requer fibra multimodo OM4 ou OM5 (OM3 não é compatível)
DR4/FR4/LR4 requer OS2fibra-monomodo
A fibra implantada antes de 2015 pode não atender aos requisitos de integridade do sinal 400G
Os conectores MPO devem ser polidos APC (ângulo de 8 graus); UPC não funcionará
Se você tiver alguma dúvida sobre a qualidade da fibra, teste antes de comprar módulos. 400G é muito menos indulgente com imperfeições da fibra do que 100G.

Tipos e especificações do módulo OSFP 400G

Tipo
Distância
Fibra
Conector
Comprimento de onda
Potência Típica
Caso de uso
SR8
OM4: 100m / OM5: 150m
Multimodo
MPO-16
850 nm
10-12W
Intra{0}}DC, clusters de IA
DR4
500m
Modo-único
MPO-12
1310 nm
8-10W
Folha-espinha, construção-a{2}}construção
FR4
2 km
Modo-único
LC Duplex
CWDM4
10-12W
Acesso ao metrô
LR4
10 km
Modo-único
LC Duplex
CWDM4
10-12W
Rede metropolitana
ZR
80-120 km
Modo-único
LC Duplex
DWDM
15-18W
DCI-de longa distância
ZR+
480+ km
Modo-único
LC Duplex
DWDM
18-23W
Coerência de-longa-distância
 
SR8 e DR4 usam óptica paralela (8 pistas transmitindo simultaneamente). Canais multiplex FR4, LR4, ZR e ZR+ em menos fibras usando CWDM/DWDM.

Processo de instalação em 6 etapas

Etapa 1: Proteção ESD.Os módulos 400G OSFP são sensíveis à descarga eletrostática. Use uma pulseira aterrada conectada ao ponto de aterramento do gabinete. Manuseie os módulos apenas pelas bordas. Nunca toque nos dedos dourados ou nas aletas do dissipador de calor.
Etapa 2: verifique o tipo de dissipador de calor.Verifique-o dissipador de calor em relação aos requisitos da sua plataforma. A diferença visual é óbvia: a parte superior-com aletas tem aletas de resfriamento verticais e fica mais alta; a parte superior plana-tem uma superfície lisa e perfil mais baixo. Tipo errado? Parar. Não remova ou modifique os dissipadores de calor.
Etapa 3: insira o módulo.Alinhe o módulo com o slot OSFP e empurre até ouvir um clique na trava. Não force. Se sentir resistência, verifique a orientação. O módulo deve deslizar suavemente com pressão moderada.
Etapa 4: limpe e inspecione a fibra.Esta etapa evita 70% das falhas no link de implantação. Inspecione oConector MPO 2face final com um microscópio de fibra antes de limpar. Se estiver limpo, conecte diretamente. Se estiver sujo, use uma ferramenta de limpeza-específica para MPO (não ferramentas padrão de 2,5 mm/1,25 mm). Inspecione novamente após a limpeza. Nunca limpe sem inspecionar primeiro, pois detritos podem arranhar a face final. Perda de inserção alvo: menos de 0,5dB por ponto de conexão.
Etapa 5: Conecte a fibra.Para conexões MPO (SR8, DR4): confirme a polaridade (o Tipo B é o padrão para óptica paralela), verifique a correspondência do conector macho/fêmea, empurre até que a trava do conector trave e mantenha um raio de curvatura mínimo de 30 mm. Para conexões LC duplex (FR4, LR4, ZR): conecte TX ao RX remoto e RX ao TX remoto e confirme se a trava LC está totalmente encaixada.
Etapa 6: verifique o link.Verifique o status do link no switch:
Arista: mostra o status da interface eth1/1
Cisco: mostrar interface eth1/1
NVIDIA: exibição de link ibstat ou ip
O link deve aparecer em 30 segundos. Caso contrário, comece a solução de problemas.

Configuração de fibra e polaridade MPO

A polaridade MPO é a principal-causa de falhas de link durante a ativação-de 400G. Entendendo os trêsesquemas de polaridadeeconomiza horas de depuração.
MPO-16 versus MPO-12:
MPO-16: 16 fibras, usadas para 400G SR8 (8 TX + 8 RX). Não suporta fuga.
MPO-12: 12 fibras, usadas para 400G DR4 (4 TX + 4 RX, 4 fibras sobressalentes). Suporta breakout para 4×100G.
Ambos requerem polimento APC (ângulo de 8 graus). O polimento UPC causa-reflexão e instabilidade do link.
Esquemas de polaridade:
Esquema
Configuração
Uso de 400G
Tipo A
Direto-
Não é padrão para 400G
Tipo B
Crossover (tecla-acima para tecla-abaixo)
Padrão para óptica paralela 400G
Tipo C
Par-invertido
Não é padrão para 400G
 
Polaridade tipo B (crossover)é o padrão da indústria para 400G SR8 e DR4. A fibra TX 1 se conecta à fibra RX 12, a fibra TX 2 à fibra RX 11 e assim por diante.
Verificação masculina/feminina:Os conectores MPO vêm em macho (com pinos) e fêmea (sem pinos). Eles devem acasalar macho-com-fêmea. As portas do módulo são normalmente masculinas.Cabos de conexãonormalmente são mulheres-para{1}}mulheres. Os cabos tronco são normalmente macho-para{4}}fêmea. Verifique antes de conectar. Forçar conectores incompatíveis danifica os pinos.

Comandos de configuração do switch

Texto
 
configurar terminal
interface Ethernet1/1
descrição "Uplink 400G OSFP para Spine-1"
velocidade 400g completa
sem porta de comutação
endereço IP 10.1.1.1/31
mtu 9216
fec rs-fec
sem desligamento
 
! Verificação
mostrar o status da interface eth1/1
mostrar interface transceptor eth1/1
Configurações principais: velocidade 400gfull define explicitamente a velocidade de 400G. O mtu 9216 permite jumbo frames para tráfego de data center. fec rs-fec ativa o RS-FEC (KP4) necessário para 400G.
SO Cisco NX-(por exemplo, Nexus 9000):
Texto
 
configurar terminal
interface Ethernet 1/1
descrição Link 400G OSFP
velocidade 400000
mtu 9216
sem porta de comutação
endereço IP 10.1.1.1/31
sem desligamento
 
! Para módulos ZR/ZR+ coerentes:
! zr-ótica fec cFEC muxponder modulação 1x400 16QAM
 
! Verificação
mostrar interface eth 1/1
mostrar detalhes do transceptor da interface eth 1/1
NVIDIA (InfiniBand NDR/Ethernet):
Modo InfiniBand:
Texto
 
ibstat
status
Modo Ethernet:
Texto
 
mostrar link ip
ethtool eth0
ethtool --show-fec eth0
O padrão do NVIDIA ConnectX-7 é NDR 400 Gb/sBanda Infini. Ele pode ser alternado para o modo Ethernet 400GbE. O FEC é principalmente gerenciado-automático e raramente precisa de configuração manual.
Nota FEC:Ambas as extremidades devem executar RS-FEC (KP4) para 400G. A incompatibilidade de FEC causa oscilação do link ou impede totalmente o link-.

Verificação e Teste

Verificação inicial do link (dentro de 5 minutos após a ativação-):Confirme se o estado do link está ATIVO, a velocidade negociada para 400G e o FEC está habilitado em ambas as extremidades.
DOM (Monitoramento Óptico Digital):Verifique a potência TX (normalmente -2 a +4 dBm por especificação do módulo), potência RX (normalmente -6 a -1 dBm) e temperatura (abaixo do limite de alarme de 70 graus).
Monitoramento pré{0}}FEC BER (5 a 10 minutos):
Aprovado: <1×10⁻⁶
Marginal: 1×10⁻⁶ a 1×10⁻⁵
Falha: > 1×10⁻⁵
Pré-FEC BER alto geralmente indica baixa qualidade da fibra, conectores sujos ou degradação do sinal. Esses links podem funcionar inicialmente, mas falharem sob carga total.
Teste de burn-in de 24-horas:Antes de entrar em produção, execute um teste de estresse de 24-horas. Gere tráfego-de taxa de linha (iperf3, TRex ou tráfego de produção simulado). Monitore os contadores de erros de hora em hora. Confirme flaps de link zero e alarmes de temperatura zero. Verifique se as contagens de correção FEC estão aumentando (o que indica degradação do link). Registre as leituras finais do DOM. Os testes de burn-in detectam falhas infantis e ligações marginais antes que afetem a produção.

Estratégia de Migração Faseada

Nem toda implantação vai direto para 400G nativo. Uma abordagem faseada reduz o risco.
Fase 1: Atualizar a camada da coluna vertebral.Substitua switches de coluna por plataformas com capacidade-de 400G. Usarcabos de fugapara conectar switches leaf 100G existentes. Funciona de forma estável por 30 a 60 dias.
Fase 2: Atualize gradualmente a camada de folhas.Atualize os switches leaf rack por rack. Use cabos breakout para manter a conectividade com servidores mais antigos. Passe para o próximo lote após confirmar a estabilidade.
Fase 3: 400G nativo.Quando todos os equipamentos suportarem 400G, remova os cabos breakout e instale 400G nativo-a-de ponta a ponta. Mantenha os cabos breakout como peças sobressalentes.
Opção de cabo breakout:Os módulos 400G DR4 suportam breakout 4×100G usando cabos duplex MPO-12 a 4×LC. Isso permite que um switch de coluna 400G se conecte a switches leaf de 100G durante a migração. A potência da conexão por 100G cai de aproximadamente 10W para cerca de 5,5W. Essa abordagem permite implantar a infraestrutura 400G antes que todos os endpoints estejam prontos.
Cerca de 70% das falhas QSFP{1}}DD são resolvidas na camada física: conectores sujos, módulos parcialmente encaixados e problemas de cabo. Antes de substituir qualquer hardware, siga um processo estruturado-de cinco estágios que abrange inspeção física, verificação CMIS, verificações de configuração, análise de qualidade de sinal e testes de isolamento. Essa abordagem resolve cerca de 90% dos problemas.
Aqui está uma história real: um engenheiro passou dois dias processando devoluções de RMA para doze módulos QSFP-DD em um switch Cisco Nexus. O sistema continuou mostrando %SFP4UNSUPPORTED_SENSE. Módulos de substituição mostraram o mesmo erro. Um colega sugeriu verificar o firmware do switch. A causa raiz? Os novos módulos CMIS 4.0 eram incompatíveis com o firmware CMIS 3.0 mais antigo do switch. Dois dias de trabalho, completamente desperdiçados.

A estrutura de solução de problemas em cinco-estágios

Estágio
Foco
Taxa de resolução aproximada
Estágio 1
Inspeção da camada física
~40%
Estágio 2
Identificação do módulo e CMIS
~25%
Estágio 3
Verificação de configuração
~15%
Estágio 4
Qualidade do sinal, BER e térmica
~10%
Estágio 5
Teste de isolamento
~10%
 
Sempre trabalhe através dos estágios em ordem. Confirme se a camada física está boa antes de passar para o Estágio 2. Confirme a identificação e configuração do módulo antes de analisar o BER no Estágio 4. Essa abordagem estruturada evita que os engenheiros façam suposições cegas e percam horas.

5-Phase QSFP-DD Troubleshooting Workflow

Etapa 1: Inspeção da Camada Física

Um módulo que parece "quebrado" muitas vezes só precisa de 30 segundos e uma limpeza-sem fiapos. A solução de problemas eficaz sempre começa no ponto de falha mais simples.
Um técnico de data center passou 3 horas solucionando problemas em um link 400G DR4 que não funcionava. Verificações de configuração, atualizações de firmware, trocas de portas: nada funcionou. Finalmente, retiraram o módulo e inspecionaram o conector MPO sob um microscópio de fibra. Uma única fibra minúscula de um cotonete estava presa no conjunto de fibras. A limpeza demorou 30 segundos. O link apareceu imediatamente. O “módulo quebrado” era apenas vidro sujo.
 
Lista de verificação de inspeção visual:
Módulo totalmente encaixado:Empurre com firmeza até ouvir o clique da trava. A inserção incompleta é a principal causa de erros intermitentes na faixa.
Dedos de ouro:Verifique os contatos elétricos quanto a corrosão, detritos ou pinos tortos. Um único pino torto na pista 3 mata um link 400G.
Danos no conector:Procure ponteiras rachadas, botas faltando e cabos torcidos. 400Os conectores G MPO-16 são mais frágeis que o MPO-12.
Tampas contra poeira:Módulos armazenados sem tampas contra poeira já estão contaminados.
Uma boa higiene dos cabos é a base para uma solução de problemas eficiente de QSFP-DD. A contaminação do conector por si só é responsável pela maioria das falhas de módulos ópticos em implantações 400G. Para uma análise mais detalhada dos tipos de cabos e da compatibilidade, consulte nosso guia de cabeamento QSFP-DD2.
 
Processo de limpeza do conector MPO:
A contaminação do conector causa 65-70% das falhas no link 400G. Na modulação PAM4, mesmo pequenos detritos criam perda suficiente para fechar o olho do sinal.
Inspecione primeiro:Use um microscópio de fibra 400×. Verifique a face final quanto a poeira, óleo ou detritos. Nunca limpe sem inspecionar primeiro.
Lenço-úmido a-seco:Aplique uma gota de fluido de limpeza de fibra em um pano-que não solte fiapos. Desenhe o conector na zona úmida e depois na zona seca.
Confirme o polimento da APC:Os módulos 400G QSFP-DD usam conectores APC (Angled Physical Contact) com um ângulo de polimento de 8 graus. Se você vir uma extremidade plana azul, isso é UPC. Você deve usar conectores APC verdes.
Re-inspecione:Limpe até que a face final passe na inspeção. Uma nova tentativa leva 30 segundos; uma falha no link custa horas.

MPO-16 APC FIber Array Inspection - Use a 400× fiber microscope. Check the end face for dust, oil, or debris. Never clean without inspecting first.

Verificações de cabos e ambientes:
Raio de curvatura:A fibra-monomodo requer um raio de curvatura mínimo de 30 mm. Muito-apertadogerenciamento de caboscausa perda de microcurvaturas, uma variável facilmente esquecida.
Alívio de tensão:Cabos tronco MPO pesados ​​puxando módulos causam problemas de contato intermitente. Poucos engenheiros verificam isso primeiro.
Fluxo de ar e sombreamento térmico:Nas configurações de gaiola-a{1}}de barriga, os módulos da-linha superior inalam o ar de exaustão pré-aquecido dos módulos-da linha inferior. As portas superiores ficam 10-15 graus mais quentes.

Etapa 2: Identificação do Módulo e CMIS

Os switches nem sempre informam o status do módulo com precisão. "QSFP-DD não detectado" é um dos problemas de campo mais comuns e frustrantes.
A Especificação de Interface de Gerenciamento Comum (CMIS) define como os módulos QSFP-DD se comunicam com switches de host. CMIS 4.0 (o padrão atual para módulos 400G/800G) introduz mapeamento complexo de memória EEPROM que firmware mais antigo não consegue analisar corretamente. O switch detecta o hardware, mas não consegue ler os parâmetros operacionais, reportando “transceptor não suportado” ou não detectando o módulo.
Comandos de detecção-específicos do fornecedor:
Plataforma
Comandos
SO Cisco IOS-XR/NX-
mostrar transceptor de interfaces, mostrar detalhes do transceptor de interfaces, mostrar módulo
Arista EOS
mostrar interfaces transceptor Ethernet1/1, mostrar interfaces transceptor eeprom
Junípero JunOS
mostrar hardware do chassi, mostrar foto do chassi fpc-slot 0 pic-slot 0
SONiC/Linux
mostrar interface transceptor eeprom Ethernet0, ethtool -m Ethernet0
 

 

Máquina de estado CMIS:
Estado
Descrição
Modo de falha comum
Baixo consumo de energia
Módulo inserido, potência mínima
Incompatibilidade de classe de potência
Energia
Inicialização do módulo
Potência da porta insuficiente
Preparar
Módulo pronto para caminho de dados
Falha na análise de firmware
Falta
Condição anormal detectada
Falha de hardware
 
Estados do caminho de dados:
Estado
Descrição
Modo de falha comum
Desativado
Nenhum caminho de dados ativo
Porta não habilitada
Iniciar
Inicialização do caminho de dados
Incompatibilidade de velocidade/FEC
Ativado
Link funcionando normalmente
Deve mostrar normal
 
Um módulo preso no Init geralmente significa velocidade ou incompatibilidade de FEC entre o host e o módulo. A incompatibilidade de versão do CMIS impede que os módulos atinjam o estado Pronto, gerando erros contínuos até que o firmware seja atualizado.
Módulos de dependência-de fornecedor e de terceiros-:
Os switches OEM verificam o campo EEPROM do ID do fornecedor. Módulos-de terceiros com codificação EEPROM correta funcionam bem. Esses erros de codificação{3}específicos do fornecedor ausentes acionam erros:
Cisco: %SFP4UNSUPPORTED_SENSE (consulteMatriz de compatibilidade de transceptores Cisco)
Juniper: transceptor não suportado
Arista: Geralmente os reconhece, mas registra um aviso
99% das falhas de módulos são causadas por problemas de compatibilidade de firmware ou de codificação EEPROM, e não por problemas de qualidade de módulos-de terceiros.
Soluções alternativas:
Cisco: serviço de transceptor-não compatível (comando oculto; pode afetar a garantia)
Juniper: algumas plataformas suportam transceptor-não compatível-
Arista: Compatibilidade mais aberta; módulos-de terceiros geralmente funcionam sem configurações especiais

Etapa 3: Verificação da configuração

O link funciona em 100G, mas não em 400G? Verifique primeiro o FEC.
Os links 400G modernos contam com Correção de Erros Avançada (FEC) para lidar com erros de bit da sinalização PAM4. A incompatibilidade de FEC é um culpado comum na solução de problemas de 400G. Uma extremidade com FEC ativada e a outra desativada significa que o link não será ativado ou gerará erros enormes.
FEC paraEthernet 400G:RS-FEC RS(544.514), também chamado de KP4 FEC. É obrigatório, não opcional.
Parâmetro
Limite normal
Ação se excedida
Pré-FEC BER
< 2.4 × 10⁻⁴
Monitorar tendência; o link ainda pode corrigir
Pós-FEC BER
< 1 × 10⁻¹²
Qualquer erro pós{0}}FEC é crítico
Palavras-código corrigidas
Linha de base estável
Aumento rápido=degradação do sinal
Palavras-código não corrigidas
0
Link diferente de{0}}zero=prestes a oscilar
 
Comandos de status FEC:
Cisco: mostrar registro-de eventos fec; mostrar hardware da plataforma alimentado com estatísticas fec ativas
Arista: mostra erros de contadores de interfaces; mostrar status fec
SONiC: mostrar contadores de interface|grep -eu fec
Configuração de interrupção:
Dividir 400G QSFP-DD em 4×100G é uma fonte comum de confusão. O mapeamento de pista deve corresponder ao ASIC do switch, ao cabo e à extremidade remota.
Mapeamento de pista padrão 400G → 4×100G:
Pistas 0-1 → Porta de breakout 1
Pistas 2-3 → Porta de breakout 2
Pistas 4-5 → Porta de fuga 3
Pistas 6-7 → Porta de fuga 4
A polaridade do MPO também é importante aqui. Os cabos breakout normalmente usam polaridade Tipo B (crossover). Se algumas portas breakout funcionarem e outras não, a polaridade é sua primeira suspeita.

Estágio 4: Qualidade do Sinal, BER e Problemas Térmicos

A tendência pré-FEC BER pode avisar sobre falhas 2 a 3 semanas antes de um link realmente cair. Detectar antecipadamente a degradação do módulo permite agendar substituições planejadas em vez de interrupções de emergência às 2h.
Interpretação dos parâmetros DDM:
O Digital Diagnostic Monitoring (DDM, também chamado de DOM) fornece telemetria-em tempo real do módulo. Na solução de problemas avançados de QSFP-DD, as leituras de DDM são seu primeiro sistema de alerta.
Parâmetro
Faixa normal
Sinal de alerta
Potência TX
Por especificação do módulo (varia)
Mais de 3dB abaixo da especificação
Potência RX
Acima da sensibilidade com margem
Abaixo da sensibilidade ou acima da sobrecarga
Temperatura
Temperatura da caixa de 25 a 70 graus
>70°C warning, >Desligamento de 85 graus
Corrente de polarização do laser
Linha de base estável
>Aumento de 20% em relação à linha de base
Tensão
3.135-3.465V
Problema de fonte de alimentação fora do alcance =
 
A tendência atual da polarização do laser é o melhor aviso antecipado na solução de problemas de QSFP-DD. Quando um laser precisa de 20% mais corrente para manter a mesma potência de saída, sua vida útil está chegando ao fim. Substitua-o durante a próxima janela de manutenção e não após uma interrupção.

Laser bias current trend is the best early warning in QSFP-DD troubleshooting. When a laser needs 20% more current to maintain the same output power, it's approaching end of life. Replace it during the next maintenance window, not after an outage.

Sombreamento térmico em gaiolas de barriga-a-barriga:
Switches 1RU de alta-densidade com 32+ portas QSFP-DD em gaiolas-a-de barriga criam um sombreamento térmico fácil de passar despercebido. Os engenheiros mediram portas-da linha superior operando 10-15 graus mais quentes que as portas da linha inferior. O sombreamento térmico causa falhas de módulos em intervalos de portas específicos, enquanto módulos idênticos funcionam bem em outros lugares.
Diagnóstico:
Compare as temperaturas do DOM em todas as portas
Procure agrupamento de temperatura por linha de gaiola
Verifique a direção e a velocidade do fluxo de ar
Confirme se os painéis vazios estão instalados em slots vazios
Considere ópticas de menor potência-(por exemplo, FR4 em vez de ZR) em posições termicamente limitadas
Noções básicas de integridade do sinal PAM4:
400G e 800G usam PAM4 (modulação de amplitude de pulso de 4-níveis) em vez do NRZ tradicional (sem-retorno-a zero). O PAM4 transporta o dobro dos dados por ciclo de clock, mas exige uma qualidade de sinal significativamente maior.
O que isso significa para solução de problemas:
Os diagramas oculares PAM4 têm três olhos. Qualquer fechamento dos olhos causa erros de bits.
Erros em pistas específicas geralmente apontam para problemas de ASIC do host, interface elétrica ou canal óptico individual.
A diafonia entre pistas dentro do mesmo módulo é pior em 400G do que em 100G.
Se os erros se concentrarem em pistas específicas (por exemplo, apenas nas pistas 2 e 3), suspeite do caminho elétrico do switch ASIC para o módulo, e não do caminho óptico.

Etapa 5: Teste de Isolamento

Troque o componente certo e você encontrará a falha em 30 segundos.
Depois de descartar problemas físicos, de CMIS, de configuração e de qualidade de sinal, o teste de isolamento estruturado é a etapa final. O objetivo: identificar o componente defeituoso (módulo, porta, cabo ou extremidade remota).
 
Árvore de decisão do teste de substituição:
Mova o módulo suspeito para uma porta-em boas condições.
Funciona → O problema é a porta ou cabo original.
Ainda falha → O módulo provavelmente está com defeito.
Coloque um módulo-em bom estado na porta suspeita.
Funciona → O módulo original está com defeito.
Ainda falha → Problema na porta ou no cabo.
Substitua o cabo.
O link se recupera → O cabo estava com defeito.
Ainda falha → Problema de porta ou módulo.
Teste a extremidade remota.
Todos os testes locais são aprovados → Repita as etapas 1-2 na extremidade remota.
Esse processo de quatro-etapas isola falhas em no máximo quatro operações. A maioria dos engenheiros pula etapas ou troca vários componentes de uma só vez, destruindo a clareza do diagnóstico. Paciência é fundamental na solução sistemática de problemas de QSFP-DD.
 
 
Teste do módulo de loopback:
Um módulo de loopback conecta internamente as pistas TX diretamente às pistas RX. É a maneira mais rápida de distinguir problemas do lado-do host e do lado-da fibra.
Quando usar loopback na solução de problemas de QSFP-DD:
O link não aparece e você precisa confirmar se a porta do switch está funcionando
A extremidade remota está inacessível e você precisa de verificação local
Suspeita de falha na pista ASIC do host
Comportamento esperado:
Inserir loopback, habilitar porta
A porta deve subir imediatamente (sem necessidade de fibra)
DOM mostra alta potência RX (normal para loopback)
BER deve estar próximo de zero
A porta não ATIVA com loopback → o problema está no lado-do host (ASIC, elétrico ou configuração). O loopback funciona, mas o módulo real não → o problema é o link óptico ou a extremidade remota.

A loopback module internally connects TX lanes directly to RX lanes. It's the fastest way to distinguish host-side from fiber-side issues.

Conclusão

Não existe um formato 400G universalmente “melhor”. A escolha certa depende do que você tem hoje e para onde irá amanhã.
Principais conclusões:
Possui infraestrutura QSFP28?Escolha QSFP-DD. A compatibilidade com versões anteriores preserva os ativos e permite a migração em fases.
Construindo um novo cluster de IA/HPC?Considere o OSFP. O espaço térmico ZR + e o roteiro 1.6T justificam a mudança de ecossistemas.
Planejando 800G?Ambos os formatos funcionam. OSFP tem vantagem térmica para módulos-de alta potência.
É-sensível ao custo?QSFP-DD oferece menor TCO na maioria dos cenários.
Antes de assinar um pedido de compra, audite seu equipamento existente, confirme as necessidades de compatibilidade com versões anteriores e calcule seu TCO, incluindo os custos de migração.
A equipe de engenharia da COBTEL ajudou data centers em todo o mundo a navegar nas transições de 400G e 800G. Como principal fabricante de transceptores ópticos de alta-velocidade2e patch cords MPO, podemos projetar a solução certa para sua infraestrutura específica.Preencha o formulário de consulta no final desta página para obter uma recomendação personalizada de nossa equipe.

Perguntas frequentes

Posso conectar um módulo QSFP28 a uma porta QSFP-DD?

Sim. As portas QSFP-DD são projetadas para aceitar módulos QSFP28. Você pode implantar switches QSFP{4}}DD e continuar usando sua óptica 100G existente. A compatibilidade é unidirecional-: os módulos QSFP-DD não cabem em portas QSFP28 porque são fisicamente mais profundos e exigem 8 pistas elétricas em vez de 4.

Qual formato tem menor custo total de propriedade?

QSFP-DD oferece menor TCO para a maioria dos ambientes corporativos. A compatibilidade retroativa com QSFP28 e maior densidade de portas (36 versus 32 portas por 1RU) reduzem a contagem de switches e eliminam custos com adaptadores. A vantagem de TCO do OSFP só se aplica a cenários específicos-de alta potência, onde seu espaço térmico justifica os gastos adicionais com infraestrutura.

Preciso substituir os cabos ao atualizar de QSFP28 para QSFP-DD?

Depende dos tipos de módulo. QSFP28 SR4 usa MPO-12, enquanto QSFP-DD SR8 usa MPO-16, então você precisará de novos cabos para essa combinação. No entanto, o QSFP-DD DR4 usa MPO-12 APC, que é compatível com a maioria das aplicações de modo único QSFP28. Verifique sempre os tipos de módulos específicos antes de encomendar cabos.

QSFP-DD e OSFP podem coexistir na mesma rede?

Eles não podem se conectar diretamente. Você precisa de um switch ou roteador com ambos os tipos de porta para conectá-los ou usar equipamento de multiplexação/encaminhamento para converter entre fatores de forma. Muitos hiperescaladores executam ambos os padrões: QSFP-DD em instalações existentes e OSFP em novas construções.

OSFP ou QSFP-DD são melhores para 800G e 1,6T?

Ambos os formatos suportam 800G atualmente (QSFP-DD800 e OSFP800 estão disponíveis comercialmente). Para módulos 800G padrão, o desempenho é comparável. Para módulos 800G de alta-potência, o espaço térmico do OSFP oferece uma vantagem. Em 1,6T2, OSFP é o formato preferido da indústria devido à sua capacidade de resfriamento superior.

Enviar inquérito

Você pode gostar também