87% de precisão do ImageNet, latência de 3,8 ms: MobileNetV4 do Google redefine a visão móvel no dispositivo 04-19
Revelando a caixa preta: a ferramenta de transparência LM da Meta decifra modelos de linguagem de transformadores 04-17
O Transformer-Lite da OPPO AI oferece 10x+ pré-preenchimento e aumento de decodificação de 2 a 3x em GPUs de telefones celulares 04-16
Revolucionando a compreensão do vídeo: legendas em tempo real para qualquer duração com o modelo de streaming do Google 04-11
DiJiang da Huawei e Pequim U: um transformador que alcança o desempenho do LLaMA2-7B por 1/50 do custo de treinamento 04-04
DeepMind e UBC’s Genie: um salto revolucionário em IA generativa para mundos virtuais interativos 03-25
‘Você transformou o mundo’, diz o CEO da NVIDIA aos pesquisadores por trás do Landmark AI Paper 03-21
O AnimateDiff-Lightning da ByteDance brilha na criação de vídeo de última geração na velocidade da luz 03-21
VideoAgent de Stanford alcança novo SOTA de compreensão de vídeo de formato longo por meio de sistema baseado em agente 03-19
Caminhos rápidos para diversos comportamentos: VQ-BeT atinge aumento de velocidade 5x em comparação com políticas de difusão 03-12
Transcenda os limites dos modelos de linguagem: bGPT permite uma compreensão mais profunda por meio da previsão de bytes 03-06