Skip to content

Скрипт для парсинга docx файлов с их конвертацией в HTML текст.

Notifications You must be signed in to change notification settings

kulbabskyy/docx-parser

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

docX-Parser

Скрипт для парсинга docx файлов и их конвертации в Html текст. В дальнейшем будем делать сохранение данных из docx файлов в облачную базу данных, чтобы создать хронологию и поиск по добавленым файлам.

На данном этапе скрипт умеет:

  • Открывать docx файлы
  • выводить их содержимое в окно просмотра
  • Удалять пустые параграфы
  • Удалять лишние пробелы и скобки
  • Преобразовывать данные в массив
  • Функция очистки окна предпросмотра

Формат docx файла:

[REPORT TYPE : NOON]
[Tmpl : AWT-STANDARD-V1]
[DRSVer : 2.5.6.0.H]
[TimeFormat : UTC]
[Vessel : CALHOUN]
[IMO : 9304576]
[CallSign : V7BT4]
[NOONLat : 19-38.6N]
[NOONLon : 087-34.9E]
[PositionDate : 2018/08/15 0630]
[NOONOffset : +5.5]

About

Скрипт для парсинга docx файлов с их конвертацией в HTML текст.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published