При копировании информации из приложений MS Office (Word, Excel, PowerPoint и др.) в исходный код страницы вставляется большое количество служебной информации. MS Office стремится к тому, чтобы документ выглядел одинаково на любом устройстве вывода: мониторе, принтере, веб-странице. Поэтому
орматирование включает в себя указание всех отступов от края листа, используемых шрифтов, стилей и другую информацию. Это в большинстве случаев приводит к тому, что документ отображается не так, как было задумано дизайнером сайта. Кроме того, большое количество ненужных тэгов в несколько раз или даже десятков раз увеличивает размер страницы.
Данный Java скрипт производит автоматическую чистку исходного кода, просто скопируййте текст из Word вставте в окошко и нажмите на иконку ввиде веника. Полученный HTML код можно увидеть нажав на вторую иконку.
Приятной работы:
https://novikov.ua/cleaner/