Já escrevemos sobre inúmeros aperfeiçoamentos no kernel do sistema operacional, redes e sistema de arquivos. Embora na maioria dos PCs cliente, o utilitário chkdsk, testado e comprovado, seja usado somente em circunstâncias muito raras, estamos aproveitando o Windows 8 como uma oportunidade de aperfeiçoá-lo. Desejamos repensar o funcionamento do utilitário para aumentar a disponibilidade e reduzir o tempo de inatividade causado pelas operações do chkdsk. Analisando o uso real do chkdsk, observamos que as corrupções são muitíssimo raras, apesar de o mesmo não ocorrer com as execuções do chkdsk. Embora tenhamos trabalhado muito para diminuir a invocação manual de ferramentas de disco (como a desfragmentação), sabemos que muitos preferem executá-las manualmente "só para garantir", portanto, trabalhamos para melhorar a produtividade geral do chkdsk porque sua execução diminui a disponibilidade do computador. Com o enorme aumento da capacidade dos discos e os sistemas de vários discos se tornando mais comuns, quisemos aperfeiçoar o utilitário. Kiran Bangalore, gerente de programas da nossa equipe de sistema principal, foi o autor desta postagem. 
--Steven


Nesta postagem, falarei sobre o novo modelo de integridade do NTFS do Windows 8 e a nossa ferramenta recriada de detecção de corrupção de disco e correção, o utilitário chkdsk.

Todos nós já passamos pela frustração causada por um chkdsk inesperado que surge em uma janela pop-up, reiniciando um computador em casa ou um servidor no escritório. Além da surpresa, há a interrupção e espera pela conclusão do processo até que o Windows volte a ficar disponível. Com o Windows 8, oferecemos uma resolução rápida para esses problemas, colocando o usuário no controle e tornando os sistemas mais disponíveis e escalonáveis.

Uma das nossas principais metas de design para o Windows 8 era aumentar a disponibilidade e diminuir a inatividade dos sistemas; esse recurso, juntamente com outros recursos de armazenamento, como os Espaços de Armazenamento e o novo sistema de arquivos ReFS, ajuda a reduzir a complexidade da correção de corrupções e aumenta a disponibilidade geral de todo o sistema.

O modelo anterior de integridade do NTFS e chkdsk

Embora muitíssimo raro, há uma variedade de causas singulares para a corrupção de disco hoje em dia. Sejam causadas por erros na mídia do disco rígido ou erros de memória transitórios, as corrupções podem ocorrer em metadados de sistemas de arquivos (as informações usadas para mapear bloqueios físicos àquela foto que você tirou nas férias no ano passado). Para manter o acesso aos seus dados, o Windows precisa isolar e corrigir esses erros, e a forma de se fazer isso é executando o utilitário chkdsk.

Nas versões anteriores, o NTFS implementava um modelo de integridade mais simples, em que o volume do sistema de arquivos estava íntegro ou não. Nesse modelo, o volume era colocado offline pelo tempo necessário para corrigir as corrupções do sistema de arquivos e retornar o volume a um estado íntegro. O tempo de inatividade era diretamente proporcional ao número de arquivos presentes no volume.

Dados confiáveis de telemetria de sistemas de todo o mundo nos mostram que, embora as corrupções sejam raras, quando o chkdsk é necessário, ele pode levar de alguns segundos a algumas horas para ser executado, dependendo do número de arquivos que houver na unidade – e até levar ainda mais tempo, no caso de servidores de armazenamento maiores.

No Windows Vista e Windows 7, otimizamos significativamente a velocidade do chkdsk, mas, como as capacidades dos discos rígidos têm dobrado a cada 18 meses e o número de arquivos por volume está aumentando no mesmo ritmo, o chkdsk tem levado cada vez mais tempo para concluir o processo (mesmo com os aperfeiçoamentos na velocidade).

Portanto, no Windows 8, alteramos a forma como abordamos o modelo de integridade do NTFS e a maneira como corrigimos corrupções, a fim de diminuir o tempo de inatividade causado pelo chkdsk. Também introduzimos um novo sistema de arquivos para o futuro, o ReFS, que não exige que o chkdsk fique offline para o reparo de corrupções.

Recriação da integridade do sistema de arquivos

O incrível aumento da capacidade de armazenamento e do número de arquivos de dados de usuários gerou a necessidade de uma recriação do modelo de integridade do NTFS e chkdsk.

Os nossos clientes deixaram clara a existência de três importantes requisitos para a integridade do sistema de arquivos:

  1. Não deve haver tempo de inatividade causado por corrupções do sistema de arquivos em configurações continuamente disponíveis e esse tempo deve ser quase nulo em todas as outras configurações.
  2. O usuário ou administrador deve ser avisado sempre sobre a integridade do sistema de arquivos.
  3. O usuário ou administrador deve poder corrigir facilmente seu sistema de arquivos em caso de corrupção de forma agendada.

O nosso design incluiu alterações no sistema de arquivos e no utilitário chkdsk para garantir a melhor disponibilidade. O novo design divide o processo nas fases a seguir para garantir uma resolução coordenada, rápida e transparente para a corrupção.

Fluxograma. Detecção de corrupção (o NTFS detecta uma anomalia nos metadados do sistema de arquivos) SETA PARA Autorrecuperação online (o NTFS tenta se recuperar rapidamente, o volume permanece online) SETA PARA Verificação online (o NTFS atesta se o problema é transitório ou genuíno, o volume permanece online) SETA PARA Identificação online e registro (se não se recuperar, o NTFS identifica e registra ações de correção, o usuário ou administrado é notificado, o volume permanece online) SETA PARA Correção rápida e precisa (o usuário ou administrador pode deixar o volume offline quando for conveniente e as corrupções registradas são corrigidas em segundos. Com CSV, a E/S é pausada de forma transparente para uma correção rápida e retomada automaticamente.

Desenvolvemos um novo método de comunicação que descreve tipos de corrupções como "verbos" que agem de acordo com os componentes-chave e apontam para o design - a unidade de sistemas de arquivos (NTFS), o módulo de autorrecuperação, o serviço de verificação de pontos e o utilitário chkdsk. Todas as corrupções de sistemas de arquivos são classificadas com um dos 18 "verbos" diferentes que definimos no Windows 8. Também abrimos espaço para novas definições de verbo que podem nos ajudar a diagnosticar problemas de forma ainda melhor no futuro.

Principais alterações no design para ajudar a aumentar a disponibilidade:

    1. Autorrecuperação online: O recurso de autorrecuperação do NTFS foi introduzido no Windows Vista (e no Windows Server 2008) para diminuir a necessidade de executar o chkdsk. A autorrecuperação é um recurso criado no NTFS que corrige determinadas classes de corrupção encontradas durante uma operação normal ainda online. Quando todos os problemas detectados são autorrecuperados online, não há necessidade de um reparo offline . No Windows 8, aumentamos o número de problemas que podem ser resolvidos online e, dessa forma, reduzimos a necessidade do chkdsk.
    2. Verificação online: Algumas corrupções são intermitentes devido a problemas na memória e podem não ser causadas por uma corrupção real do disco; portanto, adicionamos um novo serviço ao Windows 8, chamado de serviço de verificação de pontos. Ele é disparado pelo driver do sistema de arquivos e verifica se o disco foi realmente corrompido antes de mover o sistema de arquivos para o modelo de integridade. Esse novo serviço é executado em segundo plano e não afeta o funcionamento normal do sistema; ele apenas age quando acionado pelo driver do sistema de arquivos para verificar uma corrupção.
    3. Identificação e registro online: Quando um problema é verificado, ele aciona uma verificação online do sistema de arquivos, que é executada como uma tarefa de manutenção no sistema de arquivos. No Windows 8, tarefas agendadas de manutenção do computador são executadas somente quando apropriado (durante tempo ocioso etc.). Essa verificação pode ser executada como uma tarefa em segundo plano enquanto a execução de outros programas ocorre em primeiro plano. Enquanto o sistema de arquivos é verificado, todos os problemas encontrados são registrados para posterior correção.
    4. Correção rápida e precisa – Quando conveniente para o usuário ou administrador, o volume pode ser colocado offline e as corrupções registradas na etapa anterior podem ser corrigidas. O tempo de inatividade desta operação, chamado "Spotfix", dura apenas segundos e, nos sistemas do Windows Server 8 com volumes compartilhados de cluster, eliminamos totalmente esse tempo de inatividade. Com este novo modelo, o tempo de execução do chkdsk offline agora é diretamente proporcional ao número de corrupçõese não ao número de arquivos, como no antigo modelo.

O gráfico de barras compara o chkdsk no Windows Server 2008 R2 versus Windows Server 8. No sistema antigo, a verificação e correção de 10 milhões de arquivos leva 2 minutos, 4:48 para verificar e corrigir 200 milhões de arquivos e mais do que 6 minutos para verificar e corrigir 300 milhões de arquivos. No Windows Server 8, a correção pontual leva apenas 2 segundos.
Comparação entre o Windows Server: chkdsk/f e o chkdsk/spotfix

  1. Melhor capacidade de gerenciamento – Para permitir uma melhor transparência neste novo modelo de integridade, o Windows agora exibe o estado do sistema de arquivos por meio das interfaces a seguir:
    • Central de Ações – A integridade da unidade fica mais visível na Central de Ações, com o status da unidade (veja a figura abaixo), que informa quando é necessário agir para retornar o volume a um estado íntegro.
    • Explorer: o estado de integridade também é exibido no Explorer, nas propriedades da unidade.
    • PowerShell: Você também pode invocar a funcionalidade chkdsk usando um novo cmdlet no PowerShell, o REPAIR-VOLUME, que também pode ser útil para o gerenciamento remoto da integridade do sistema de arquivos.
    • Gerenciador do servidor: No Windows Server, você também pode gerenciar os estados de integridade de volume diretamente no utilitário do gerenciador do servidor.

O novo modelo de integridade do sistema de arquivos

No novo modelo de integridade, o status da integridade do sistema de arquivos passa por quatro estados: alguns simplesmente informativos e outros que requerem ação. Os estados de integridade são:

  1. Online e íntegro
  2. Necessidade de verificação de pontos online
  3. Necessidade de exame online
  4. Necessidade de correção pontual

Íntegro > Necessidade de verificação de pontos > Necessidade de exame online > Necessidade de correção pontual > Íntegro.
Estados de integridade do sistema de arquivos do Windows 8

      1. Online e íntegro – Neste estado, não há nenhuma corrupção do sistema de arquivos detectada e não é necessária nenhuma ação. O sistema de arquivos permanece neste estado durante a maior parte do tempo.

    A Central de Ações mostra que não é necessária nenhuma ação

      1. Necessidade de verificação de pontos online– O sistema de arquivos permanece neste estado transitório por um breve instante após o sistema de arquivos detectar uma corrupção e a autorrecuperação não ser possível; ele coloca o volume nesse estado até que a corrupção seja verificada pelo serviço de verificação de pontos. Novamente, nenhuma ação por parte do usuário é necessária.
      2. Necessidade de exame online– Quando o serviço de verificação de pontos confirma a corrupção, ele coloca o sistema de arquivos no estado "Necessidade de exame online". Na próxima janela de manutenção, é realizado um exame online; não é necessária nenhuma ação por parte do usuário. Esse estado é refletido na Central de Ações para que você possa realizar o exame manualmente caso deseje fazê-lo antes da próxima janela de manutenção. O exame é realizado em segundo plano, o que significa que você pode continuar usando o computador durante a operação. Durante o exame online, todos os problemas e correções verificados são registrados para reparo posterior. Nos sistemas do Windows Server 8, o tempo ocioso é determinado pela monitoração da CPU e pelos tempos ociosos do armazenamento.

    Mensagem [Scan drive for errors] (Examine a existência de erros na unidade), link [Open Action Center] (Abrir a Central de Ações)

    Abaixo de [Maintenance] (Manutenção), aparece [Scan drive for errors] (Examine a existência de erros na unidade) [We found potential errors on a drive, and need to scan it.] (Possíveis erros foram localizados em uma unidade e ela deve ser examinada). [You can keep using the drive during the scan.] (Você pode continuar usando a unidade durante o exame.) Botão: [Run scan] (Executar exame). Link de ação: [Turn off messages about drive status] (Desativar mensagens sobre o status da unidade).

    1. Necessidade de correção pontual– O sistema de arquivos coloca o volume nesse estado após a conclusão do exame online, se necessário, e esse estado é refletido na Central de Ações. Em sistemas cliente, você pode reiniciar o PC para corrigir todos os problemas do sistema de arquivos registrados na etapa anterior. A reinicialização é rápida (adiciona apenas alguns segundos) e o PC retorna ao estado de integridade. Para os sistemas do Windows Server 8, a reinicialização não é necessária para corrigir corrupções em volumes de dados. Os administradores podem simplesmente agendar uma correção de pontos na próxima janela de manutenção.

    Notificação [Restart to repair drive errors.] (Reiniciar para reparar erros na unidade). [Click to restart your PC.] (Clique para reiniciar o seu PC.)

    [Restart to repair drive errors (important) We found errors on a drive.] (Reinicie para reparar erros na unidade (importante) Foram localizados erros em uma unidade.) Para reparar esses erros e evitar a perda de dados, reinicie o PC agora. Botão: [Restart] (Reiniciar)

    Usuários mais avançados que desejarem evitar reiniciar seu sistema para corrigir a corrupção de um volume que não seja do sistema, podem abrir a caixa de diálogo Propriedades do volume afetado e, na guia Ferramentas, selecionar a opção de verificar se há erros no sistema de arquivos da unidade. A corrupção em unidades que não estão em uso no momento podem ser corrigidas sem a necessidade de uma reinicialização completa do computador.

    Na guia Ferramentas, em Verificação de erros, [This option will check the drive for file system errors.] (Esta opção verificará se há erros no sistema de arquivos.) Botão: Verificar

    [Error Checking (Chk2 (D:)) Repair this drive We found errors on this drive.] (Verificação de erros (Chk2 (D:)) Reparar esta unidade Foram localizados erros nesta unidade. [To prevent data loss, repair this drive now.] (Para evitar a perda de dados, repare esta unidade agora.) [Repair drive You won't be able to use the drive while Windows repairs errors found in the last scan.] (Repare a unidade Você não poderá usar a unidade enquanto o Windows repara erros localizados no último exame. [You might need to restart your computer.] (Talvez seja necessário reiniciar o computador.) Botão: Cancelar.

    Conclusão

    No Windows 8, tornamos a detecção e correção de erros no sistema de arquivos mais transparente e menos importuna. Acreditamos que essas alterações sejam um aperfeiçoamento bem-vindo para você e esperamos os seus comentários.

    -- Kiran Bangalore
     Gerente de programas sênior, Sistemas de arquivos e armazenamento principal do Windows


    Baixe este vídeo para assistir no seu media player favorito:
    MP4 de alta qualidade | MP4 de qualidade inferior

    Perguntas frequentes

    P) O novo modelo de integridade funcionará em unidades removíveis?
    Sim, ele funciona em unidades removíveis que relatam mídia fixa, como a maioria dos discos rígidos.

    P) Como faço para habilitar o novo modelo de integridade do sistema de arquivos?
    Você não precisa fazer nada, o novo modelo de integridade do sistema de arquivos é habilitado por padrão.

    P) O novo modelo de integridade do sistema de arquivos se aplica ao Windows Server?
    Sim, o modelo de integridade é idêntico para o servidor e o cliente. Uma coisa que será diferente por padrão é que as unidades de dados não serão verificadas ou corrigidas durante a inicialização do sistema. Essa manutenção ficará a cargo do administrador quando o tempo permitir.

    P) Posso migrar entre o Windows 8 e o Windows 7 e não afetar o modelo de integridade do sistema de arquivos?
    Sim, o modelo de integridade do sistema de arquivo se adaptará à versão do sistema operacional em que ele estiver montado.

    P) O ReFS precisará executar o chkdsk?
    O ReFS segue um modelo diferente de resiliência e não precisa executar o utilitário chkdsk tradicional.

    P) Precisarei executar o antigo chkdsk/f?
    Há casos em que um hardware com falha pode produzir uma corrupção tão grave que não seja possível montar o sistema de arquivos; você deve, então, executar um chkdsk offline completo para corrigir o sistema de arquivos. Se, por alguma razão, isso falhar, recomendamos que você restaure a partir de um backup.

    P) É realmente necessária a reinicialização para corrigir volumes que não sejam do sistema?
    Não, mas a Central de Ações normalmente oferece a experiência mais simples. Caso seja um usuário avançado, você pode corrigir volumes que não sejam do sistema abrindo as propriedades da unidade ou executando chkdsk \scan <volume>: e chkdsk \spotfix <volume>: na linha de comando.

    P) Executo o chkdsk /f com frequência para verificar o status das nossas unidades, isso ainda é necessário?
    Não, o sistema informará quando for detectada uma corrupção e você poderá, então, optar por executar o chkdsk /scan para detectar todos os problemas. Um chkdsk /scan online não afetará a disponibilidade da unidade ou sistema.

    P) Hoje eu executo o chkdsk somente leitura para verificar o status das nossas unidades, ainda preciso fazer isso?
    Não, recomendamos que, em vez disso, você execute o chkdsk/scan porque ele também executará todas as reparações online possíveis, além de se preparar para um spotfix, caso necessário.