Resultados da pesquisa por "QWEN"
23:03

Hugging Face Código aberto top modelos

Jin10 dados 9 de julho, hoje de madrugada, a famosa plataforma de modelos abertos Hugging Face lançou o código aberto, o modelo de pequeno parâmetro de topo SmolLM3. SmolLM3 tem apenas 3 bilhões de parâmetros, mas seu desempenho supera em muito os modelos abertos semelhantes como Llama-3.2-3B e Qwen2.5-3B. Possui uma janela de contexto de 128k, suportando 6 idiomas, incluindo inglês, francês, espanhol e alemão. Suporta modos de raciocínio de pensamento profundo e não pensamento, permitindo que os usuários alternem flexivelmente.
Mais
B3.76%
10:01

Alitongyi k asks, to renew

QwQ-Max está prestes a lançar a versão oficial, sob a licença Apache 2.0, tanto Código aberto QwQ-Max como Qwen2.5-Max, e também oferece versões mais leves como QwQ-32B, que podem ser implantadas em dispositivos locais. Simultaneamente ao lançamento oficial do QwQ-Max, serão lançadas as aplicações para Android e iOS.
Mais
MAX-9.51%
APP0.15%
09:02

Loongson Technology: Loongson processors successfully run the DeepSeek large model

A Longxin Zhongke lançou com sucesso o modelo DeepSeek R1 7B, equipado com o processador Longxin 3, para implantação localizada. Ele possui um desempenho excelente e um custo excelente, proporcionando aos usuários uma experiência de treinamento e inferência mais rápida, mais poderosa e mais econômica. A Longxin está trabalhando em conjunto com parceiros como Taichu Yuanyi, Cambricon, Tianshu Zhixin, Alchip Technology e openEuler para criar uma plataforma de inferência multimodal para a série de modelos DeepSeek.
Mais
DEEPSEEK-2.82%
  • 1
13:10

Jingwei Hengrun: A empresa implantou o DeepSeek e o Qwen

Jingwei Hengrun usa grandes modelos como DeepSeek e Qwen para desenvolver aplicações profissionais de IA, cobrindo vários campos, como assistência inteligente, design, testes, otimização de produtos e inteligência de processos de negócios. Estas aplicações melhoram a eficiência e a qualidade do trabalho e reduzem os custos.
Mais
DEEPSEEK-2.82%
  • 3
  • 1
04:19
A Golden Ten Data informou em 29 de abril que Tongyi K Man lançou o modelo de parâmetros de malha Qwen1.5-110B pela primeira vez, mostrando excelente desempenho em avaliações de benchmark mais longas, como MMLU, TheoremQA e GPQA. Atualmente, a série Qwen 1.5 acumulou 10 modelos grandes de código aberto, e o número de downloads de modelos Tongyi K Código aberto ultrapassou 7 milhões.
23:02
A Golden Finance reporta que a equipe da Ali Qwen lançou oficialmente o seu mais recente resultado de pesquisa - o modelo de linguagem QwQ-32B, que, com apenas cerca de 1/21 dos parâmetros do DeepSeek-R1, alcançou um avanço de desempenho através de aprendizagem por reforço.
DEEPSEEK-2.82%
  • 1
  • 1
12:16

A Fourth Paradigm lança a solução de ponta de inferência de modelos de grande escala ModelHub AIoT

Os dados do Jinshi em 26 de fevereiro, souberam que a Quarta Forma lançou a solução de ponta de inferência de IA ModelHub AIoT, os usuários podem implantar facilmente modelos de destilação de pequeno porte, incluindo DeepSeek R1, Qwen 2.5, série Llama 2/3, e realizar execução offline na ponta. Os usuários podem alternar flexivelmente entre vários modelos, considerando a compressão do modelo e o desempenho da inferência, resolvendo a complexidade da implantação e otimização. A empresa afirmou que esta solução não só pode atender às necessidades dos usuários em termos de privacidade e tempo real, mas também reduziu significativamente os custos de inferência de grandes modelos de IA.
Mais
DEEPSEEK-2.82%
09:58

A Fourth Paradigm lança a solução all-in-one SageOne IA para grandes modelos de inferência

A Quarta Paralela lançou o SageOneIA, um grande dispositivo integrado de inferência de modelo, que reduz o custo de inferência de grandes modelos. A tecnologia de pool de computação inteligente está integrada na solução do dispositivo, suportando vários modelos grandes populares. As empresas podem alternar entre os modelos completos e os modelos destilados, aumentando a utilização da GPU em mais de 30% e melhorando o desempenho de inferência em 5-10 vezes.
Mais
11:29

AliExpress International site integrates DeepSeek large model

A data de 12 de fevereiro, a Ali International AI já integrou grandes modelos como DeepSeek, que serão totalmente aplicados em todos os principais aspectos do comércio exterior. Após a integração, quando a IA receber automaticamente clientes no exterior, será capaz de considerar mais abrangentemente a intenção das perguntas dos compradores e, em seguida, combinar insights de mercado, experiência em comércio exterior e a situação dos produtos dos comerciantes na Ali International para raciocínio de Profundidade. Além disso, a Ali International também está testando perguntas gerais.
Mais
DEEPSEEK-2.82%
23:46

Estrutura de inovação Código aberto da Microsoft: transformando o DeepSeek em um Agente de IA

A Microsoft lançou a versão mais recente do OmniParser V2.0, melhorando a eficiência e precisão do AI Agent no uso do computador, especialmente na detecção de elementos de UI de pequeno porte e na melhoria da velocidade de raciocínio. Esta versão também teve um desempenho significativamente melhor no teste de Referência de Agent de alta resolução, atingindo uma impressionante taxa de precisão de 39,6%. Além disso, a Microsoft também abriu o código-fonte da ferramenta chave omnitool usada para converter grandes modelos em Agent.
Mais
DEEPSEEK-2.82%
AGENT3.08%
GPT-1.37%
  • 2
  • 4

Assuntos populares

Mais

Calendário Cripto

Mais
Maiores Eventos
Associações de blockchain e outras organizações instaram o governo Trump a impedir, até 29 de julho, que o JPMorgan impusesse um "imposto punitivo" sobre o acesso a dados. Essas organizações alertaram que o plano do JPMorgan de cobrar taxas pelo acesso aos dados bancários dos consumidores pode levar à perda de contas bancárias para milhões de americanos e pode prejudicar a adoção de moedas estáveis (USDC, USDT) e carteiras hospedadas.
2025-07-29
Chamada da Comunidade
O Conflux Token realizará uma chamada comunitária no dia 30 de julho, com os co-fundadores Fan Long ao lado do novo diretor de tecnologia Guang Yang. A agenda incluirá um resumo dos desenvolvimentos do segundo trimestre, uma visão geral dos objetivos para o terceiro trimestre e uma apresentação inicial do próximo garfo da rede.
2025-07-29
Chamada da Comunidade
A Star Atlas realizará uma chamada comunitária no dia 30 de julho, durante a qual um filme de três minutos está programado para ser lançado.
2025-07-29
Demonstração do Dia dos Bloquear Aurora
A Aurora irá sediar o Aurora Blocks Demo Day no dia 30 de julho às 16:00 UTC. O evento contará com cinco equipes apresentando pitches de cinco minutos, cada uma apresentando um projeto de blockchain em vez de apenas um aplicativo. As equipes participantes incluem OptimaFi, Coiniseasy, Sproutly, Tradable e Omega Network. O evento destaca o foco da Aurora em implantações de blockchain escaláveis e do mundo real.
2025-07-29
Chamada da Comunidade
A Helium realizará uma chamada comunitária no Discord no dia 30 de julho às 16:00 UTC para delinear os próximos parâmetros de halving, revisar marcos importantes e discutir iniciativas planejadas; um segmento ao vivo de perguntas e respostas com as equipes de desenvolvimento principais está agendado.
2025-07-29
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)