2011-04-24 07:36:29 +0000 2011-04-24 07:36:29 +0000
155
155

Как определить тип файла без расширения в Windows?

Иногда я получаю файлы от своих клиентов, которые имеют неправильное файловое расширение. Например, имя - image.jpg, но на самом деле файл представляет собой изображение в формате TIFF. Во многих случаях я могу прояснить это, открыв файл в текстовом редакторе, посмотрев на первые несколько байт, а затем вычислив, какой это тип файла.

Для меня это работает с файлами JPEG, TIFF, GIF и PDF. Однако существует гораздо больше типов файлов.

Можно ли автоматизировать определение правильного типа файла, анализируя содержащиеся в нем данные?

Ответы (5)

147
147
147
2011-04-24 07:47:21 +0000

Для идентификации файлов можно использовать инструмент TrID , который имеет растущую библиотеку определений типов файлов.

Wildcards поддерживаются, поэтому в вашем примере вы можете просто поместить все изображения для изучения в папку, например, C:\verifyimages - тогда вы можете использовать команду:

trid C:\verifyimages\*

Это изучит все файлы в папке verifyimages.


Также доступна версия GUI, TrIDNet :

Доступна документация о том, как можно легко интегрировать TrID или TrIDNet в Проводник Windows и Total Commander:

** Проводник Windows**

Итого команда

53
53
53
2011-04-24 07:38:08 +0000

файл

File тестирует каждый аргумент в попытке классифицировать его. Существует три набора тестов, выполняемых в таком порядке: тесты файловой системы, тесты магических чисел и языковые тесты. При успешном выполнении теста first выводится тип файла.

Выведенный тип будет, как правило, содержать одно из слов text (файл содержит только печатные символы и несколько общих управляющих символов и, вероятно, безопасен для чтения на ASCII терминале), executable (файл содержит результат компиляции программы в форме, понятной какому-либо UNIX ядру) или data, означающей что-либо другое (данные, как правило, “двоичные” или непечатные). Исключение составляют хорошо известные форматы файлов (файлы ядра, архивы tar), которые, как известно, содержат двоичные данные.

14
14
14
2011-04-24 13:16:09 +0000

Раньше я работал в Национальной библиотеке Франции, где создавал цифровую архивную систему, содержащую не только оцифрованные книги, но и миллионы цифровых артефактов со всевозможными странными типами файлов. Мы использовали JHOVE для распознавания форматов файлов.

JHOVE имеет открытый исходный код, он поддерживается JSTOR и библиотекой Гарвардского университета. Он довольно прост для использования .

1
1
1
2018-06-04 11:24:55 +0000

Вы можете проверить тип файла с любого компьютера, включая окна, по адресу http://www.checkfiletype.com .

1
1
1
2011-04-24 11:30:15 +0000

Я использую Oracle’s OutsideIn libraries в своих программах. Не бесплатные, но они хорошо работают, особенно для изображений. Рынок говорит, что он поддерживает более 500 типов файлов.

Похожие вопросы

3
19
10
28
10