Проверить правописание текста на русском языке: Проверка орфографии и грамматики онлайн, проверка на ошибки правописания в тексте

Содержание

Проверка правописания в Intellij Idea для русского текста

Вопрос задан

Изменён 8 месяцев назад

Просмотрен 7k раза

Как настроить проверку правописания (орфографии) в Intellij Idea для русского текста?

  • intellij-idea
  • проверка-орфографии

Для WebStorm на mac это тоже работает.

  1. Скачиваем словарь http://www.winedt.org/dict.html
  2. Распаковываем архив. Он представляет собой три словаря.
  3. Добавляем словари. WebStorm -> Preferences -> Editor -> Spelling -> Dictionaries -> внизу нажать плюсик “Add custom dictionaries”.

Для phpstorm (думаю, что и в других продуктах jetbrains) есть решение проще и правильнее скачивания словаря 2010 года.

UPD: В версиях, начиная с 2021.2.1 эту настройку переместили в Natural Languages:

File | Settings | Editor | Natural Languages

Переходим в меню “File | Settings | Editor | Proofreading”, где видим установленный язык ‘english (usa)’:

жмем на плюсик и добавляем русский язык:

и сохраняем.

Для установки доп. словарей нужно:

  1. Скачать словарь.
  2. Установить в Intellij Idea: Settings → Editor → Spelling → Custom Dictionaries.

1

Актуально следующее:

File -> Settings -> Editor -> Natural Languages

Если отсутствует пункт Natural Languages

File -> Settings -> Editor -> Natural Languages

Нужно установить плагин Grazie и перезапустить IDE (в моем случае RubyMine 2022.1), тогда он появиться и можно добавить русский язык или любой другой.

Зарегистрируйтесь или войдите

Регистрация через Google

Регистрация через Facebook

Регистрация через почту

Отправить без регистрации

Почта

Необходима, но никому не показывается

Отправить без регистрации

Почта

Необходима, но никому не показывается

Нажимая на кнопку «Отправить ответ», вы соглашаетесь с нашими пользовательским соглашением, политикой конфиденциальности и политикой о куки

Автоматическая установка языка проверки правописания в Microsoft Word

Почему Word нередко пытается проверять орфографию русских слов по английским словарям и наоброт? И не определяет язык проверки правописания автоматически?

Когда вы вводите текст вручную, система, как правило, корректно определяет язык проверки для вводимых слов. Сложности возникают, например, если вы копируете тексты из других приложений, например, из веб-браузера, или работаете с текстами, содержащими большое число английских терминов, не требующих проверки. Хотя в справочной системе описываются механизмы, призванные решать проблемы проверки правописания текстов, написанных с использованием разных языков (например, здесь и здесь), на практике они не помогают.

Создается впечателение, что, как и во многих других случаях, разработчики Word вообще никак не пытаются учесть языковые особенности, свойственные России.

Ярким тому доказательством, является первая фраза раздела официальной русскоязычной документации Word 2010 «Переключение языка средства проверки правописания»: «Предположим, пользователь создаёт документы на нескольких языках на основе латиницы (например, на английском, французском и немецком) и ему нужно быстро переключаться между этими языками во время работы…». Или первое предложение раздела «Включение языковых параметров, настраиваемых автоматически» автономной документации: «

Мартин работает в Канаде и регулярно переписывается со своей семьёй в Испании и Франции». На этих примерах в справочной системе демонстрируется удобство Word, но они совершенно не применимы к реалиям русскоязычных документов, когда используются языки с полностью разным набором символов, или когда речь часто идёт не о том, что в тексте на одном языке встречаются фрагменты или фразы текста на другом, а о том, что в тексте на одном (русском) встречается большое количество отдельных слов, например, терминов или названий, на другом (английском).

Фактически, единственное решение, предлагаемое пользователям — вручную выделять разбросанные по тексту английские слова и устанавливать для них нужный язык проверки правописания. Делается это в меню «Рецензирование—Язык—Язык проверки правописания…»:

Обнадёживающая, на первый взгляд, опция «Определять язык автоматически» работает только при наборе текста и не применима к уже набранному или вставленному из других приложений тексту.

Решить данные проблемы представляется возможным с использованием макросов VBA.

Предлагаю два таких макроса.

Первый позволяет автоматически установить английский язык (США) проверки правописания для всех слов текста, написанных целиком латиницей. Второй — отключить проверку правописания для всех слов текста, содержащих хотя бы один символ латиницы. Оба макроса применяются только к выделенному вами фрагменту текста.

Например, если ваш текст содержит слова на английском, а Word пытается проверить их орфографию русским словарём, вы можете выбрать фрагмент текста и запустить первый макрос.
Если же вы, например, имеете дело с фрагментом кода программы, который содержит множество слов латиницей, не требующих проверки правописания, но при этом содержит комментарии на русском, требующие проверки по русскому словарю, то вы можете выделить этот фрагмент, вручную установить язык правописания «русский» для всего фрагмента, а затем запустить второй макрос, исключив из проверки все слова, кроме русских.

Чтобы воспользоваться макросами, специальных знаний не требуется. Выполните следующие шаги.

Установка макросов в ваш документ:
1. Откройте ваш документ Word и нажмите сочетание клавиш Alt+F11. Откроется окно c названием Microsoft Visual Basic for Applications.

2. В этом окне слева в разделе Project найдите ваш открытый документ (названия перечислены в скобках), щёлкните по нему правой клавишей мыши и выберите в открывшемся контекстном меню пункт «Insert…—Module».
3. В открывшееся пустое окно созданного модуля вставьте следующий код:

Sub Установить_язык_правоп_англ_для_слов_латиницей()
    Dim selRange As Range
    Set selRange = Selection.Range
    Dim nextWord As Range
    Dim nextCharacter As Range
    Const charactersLAT As String = " abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ"
    Dim isLAT As Boolean
    For Each nextWord In selRange.Words
        isLAT = True
        For Each nextCharacter In nextWord.Characters
            Dim pos As Integer
            pos = InStr(charactersLAT, nextCharacter.
Text) If pos = 0 Then isLAT = False Exit For End If Next If isLAT = True Then nextWord.LanguageID = wdEnglishUS nextWord.NoProofing = False End If Next End Sub Sub Не_проверять_правоп_слов_содержащих_латиницу() Dim selRange As Range Set selRange = Selection.Range Dim nextWord As Range Dim nextCharacter As Range Const charactersLAT As String = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ" Dim isLAT As Boolean For Each nextWord In selRange.Words isLAT = False For Each nextCharacter In nextWord.Characters Dim pos As Integer pos = InStr(charactersLAT, nextCharacter.Text) If pos > 0 Then isLAT = True Exit For End If Next If isLAT = True Then nextWord.NoProofing = True End If Next End Sub

4. Закройте окно Microsoft Visual Basic for Applications.

Использование макросов:
1. Выделите фрагмент текста.
2. Нажмите сочетание клавиш Alt+F8 и выберите один из двух макросов («Установить_язык_правоп_англ_для_слов_лат

иницей» — первый, «Не_проверять_правоп_слов_содержащих_латиницу» — второй.), нажмите «Выполнить».

Вот такие особенности имеет механизм проверки орфографии и грамматики в самом распространенном текстовом редакторе, который, к слову, развивается и совершенствуется уже ни много ни мало, 23 года.

Tags: ms word, vba

Русский Транслит, Транслитерация и Виртуальная Клавиатура

Наши Услуги

Букмарклет Translit
Для более быстрого доступа к Русскому Транслиту.

Инструменты для веб-мастеров
Баннеры и виджеты для размещения на вашем сайте.

Онлайн-проверка орфографии
Бесплатный многоязычный веб-сервис проверки орфографии.

сообщите об этом объявленииTranslit News

Грузинская транслитерация и виртуальная клавиатура

2008-05-26: Тем, кому нужно печатать на грузинском языке, мы рады предложить нашу виртуальную грузинскую клавиатуру.

Греческая транслитерация и перевод на греческий язык

2008-05-26: Теперь греческая община и изучающие греческий язык обеспечены греческим переводчиком, который преобразует греческий и латинский шрифты.

Транслитерация белорусского языка

23 мая 2008 г.: Сразу за болгарской версией следует преобразователь белорусской транслитерации. Любая обратная связь от пользователей очень приветствуется.

Болгарская транслитерация

23 мая 2008 г.: Сегодня мы расширяем нашу многоязычную службу транслитерации за счет конвертера болгарской транслитерации и проверки орфографии.

Подпишитесь на Translit.CC

Если вы заинтересованы в нашем многоязычном проекте транслитерации и хотите быть в курсе последних событий и функций, вы можете посетить наш блог транслитерации или подписаться на нашу любимую ленту читатель или введите свой адрес электронной почты ниже для подписки на информационный бюллетень.

© 2007 TRANSLIT. CC . Все права защищены.

Что такое транслитерация?

Слово Транслитерация происходит от латинского transliteratus ( транс- «поперек» + littera «буква»). Транслитерация — это способ представления букв или слов одного алфавита символами другого алфавита или письменности.

Особый случай, когда к русским буквам применяется транслитерация для представления их латинскими буквами, называется Транслит . Первоначально транслит применялся только в русскоязычном сообществе (известном как « Русский транслит “) для транслитерации кириллических текстов, а позже широко применялся для многих других нелатинских языков и алфавитов.

Зачем использовать TRANSLIT.CC? Интернет-сообщество и лингвисты.Наш онлайн-конвертер кириллицы

— это одновременно мощный и простой в использовании инструмент.Транслитератор оптимизирован, чтобы потреблять меньше ресурсов и выполнять перевод быстрее, чем большинство других подобных веб-приложений.

С помощью этого сервиса русской транслитерации вы можете решить несколько задач. Преобразователь транслита может помочь вам эмулировать русскую клавиатуру , таким образом создавая правильные русские кириллические буквы при вводе соответствующих латинских (например, с использованием английской, немецкой, французской клавиатур) клавиш. Эта функция транслитератора выполняет функцию фонетической клавиатуры русского языка и может помочь вам тогда, когда у вас нет доступа к обычной русской клавиатуре или русской раскладке. Эмулятор русской клавиатуры также доступен для прямого доступа с помощью мыши. на экране Русская клавиатура находится в правой части экрана под надписью «Русская виртуальная клавиатура».

Специально для лингвистов и профессиональных переводчиков наш онлайн-сервис русской транслитерации позволяет выбирать между различными таблицами транслитерации латиница-кириллица . На данный момент поддерживаются стандарт ГОСТ 7.79 (русский язык: « ГОСТ 7. 79 ») System B и стандарт ISO 9 . Таблицы транслитерации отображаются справа от конвертера русской транслитерации. Выбрать предпочтительную русскую таблицу транслитерации вы можете из выпадающего меню «Способ транслитерации» в правом нижнем углу русской виртуальной клавиатуры.

Интерфейс конвертера русской транслитерации двуязычный и поддерживает английский и русский языки. Переключиться с одного языка на другой можно, нажав на изображение российского/американского флага в левом верхнем углу русского транслитного сайта.

Как работает конвертер русского транслита?

Преобразование латиницы в русскую кириллицу выполняется в режиме реального времени по мере ввода. Преимущество этого транслитного преобразования «на лету» заключается в том, что вы можете сразу увидеть результат на экране.

Иногда может потребоваться отключить автоматическое преобразование на русский язык, чтобы набирать части текста на английском языке. Это легко сделать, нажав кнопку «Автоматическое преобразование» над текстовым полем транслитерации или нажав кнопку ESC (ESC) на обычной клавиатуре компьютера. Чтобы снова включить автоматическую конвертацию на русский язык, нажмите ту же кнопку еще раз.

Конвертер русского транслита автоматически экранирует любой текст, написанный внутри HTML (например, ) или коды BB (например, [b] ). Эта функция в основном предназначена для тех из нас, кто часто общается на русскоязычных форумах, где использование HTML или BB-кодов является обычной практикой. Однако, если эта функция не требуется, ее можно легко отключить, нажав один раз кнопку «Пропустить теги» над областью текста русской транслитерации.

Ключи преобразования → КИРИЛЛИЦА и → ЛАТИНА предназначены для перевода текста из области ввода в кириллицу или латиницу соответственно. Если только выделена часть текста и нажата одна из клавиш преобразователя транслита, то преобразование затронет только эту выделенную часть текста, а остальной текст останется в исходном сценарии. Если нет текста или весь текст в области транслитного текста выбран и нажата одна из клавиш преобразования, то преобразование будет применено к всему тексту в области транслитного текста.

Помимо транслитерации с английского на русский, вы можете использовать набор расширенных языковых инструментов и функций. Эти функции доступны в раскрывающемся меню в нижней правой части основной формы ввода конвертера транслита. Они выполняют следующие задачи:

  • Проверка русской орфографии – Проверка русской орфографии – чрезвычайно полезная функция, которая всегда очистит ваши тексты от ошибок и опечаток. Мы настоятельно рекомендуем проверить орфографию вашего транслитерированного русского текста после того, как вы закончите печатать.
  • Поиск на Google.ru – По нашему мнению, Google является лучшей поисковой системой, доступной на рынке. Если выделить часть текста в текстовой области преобразователя транслитерации и выбрать пункт «Поиск в Google», часть выделенного текста будет отправлена ​​для поиска на веб-сайт Google. Если выделен весь текст или нет текста, то весь текст, содержащийся в текстовом поле русской транслитерации, будет отправлен для поиска в Google.
  • Поиск на Яндекс.ру — Яндекс — еще одна популярная поисковая система среди русскоязычного сообщества. В отличие от Google он будет искать только в русскоязычной части Интернета. Здесь применяются те же правила отбора, которые были описаны выше.
  • Поиск на Рамблере.ру – Рамблер тоже старая русская поисковая система и развлекательный портал. Так же, как и Яндекс, будет искать только в русскоязычной части Интернета. Те же правила выделения текста, что и для Google.
  • Перевод с русского на английский – Используя эту функцию, теперь вы можете найти любое русское слово в русско→английском словаре или перевести часть русского текста на английский с помощью машинного переводчика. Какая операция будет выбрана, зависит от вашего выбора. Если вы выделили (подсветили) только одно русское слово , то это слово будет отправлено на поиск в словарь. Если было выбрано более одного слова или не было выбрано и область текста транслитерации содержит какой-либо текст, то конвертер предполагает, что вы хотите перевести текст с помощью машинного переводчика, и направит вас на наш партнерский сайт, который попробуйте перевести текст с русского на английский.
  • Перевод с русского на немецкий . Выполняется точно такая же операция, как и для перевода с русского на английский , но только на немецкий язык. Здесь применяются те же правила отбора.
  • Перевод с русского на французский . Выполняется точно такая же операция, как и для перевода с русского на английский , но только на французский язык. Здесь применяются те же правила отбора.
  • Перевод с русского на испанский – Будет выполнена точно такая же операция, как и для перевода с русского на английский , но только на испанский язык. Здесь применяются те же правила отбора.
  • Ваш любимый сервис – Как вы думаете, мы могли бы добавить сюда какую-нибудь полезную функцию? Тогда, пожалуйста, напишите нам короткое сообщение, и, возможно, в следующий раз вы найдете здесь свой любимый сервис!

Весь ввод и вывод, а также весь сайт конвертера кириллицы в латиницу оформлены в универсальном наборе символов Unicode с использованием кодировки UTF-8 . Это новейший стандарт, и он должен быть совместим с большинством современных веб-браузеров и текстовых процессоров.

Условия предоставления услуг

TRANSLIT.CC (веб-сайт translit.cc и его поддомены) по своему собственному усмотрению может изменить условия и порядок работы этой онлайн-службы транслитерации в любое время. Используя службу русской транслитерации, пользователь отказывается от любых прав или претензий, которые он может иметь в отношении TRANSLIT.CC и всех других аффилированных лиц/партнеров. Не ограничивая вышеизложенное, инструмент транслитерации TRANSLIT.CC не несет ответственности перед вами или вашим бизнесом за любые случайные, косвенные, особые или штрафные убытки или упущенную выгоду, вмененную прибыль или лицензионные платежи, возникающие в связи с настоящими условиями или любыми товарами или услугами, предоставленными, будь то за нарушение гарантии или любого обязательства, вытекающего из нее или иным образом, независимо от того, заявлена ​​ли ответственность в договоре или нет (включая небрежность и строгую ответственность за качество продукции), и независимо от того, были ли вы уведомлены о возможности таких убытков или ущерба. Настоящим каждая сторона отказывается от любых утверждений о том, что эти исключения лишают такую ​​сторону адекватных средств правовой защиты.

Служба языковой транслитерации TRANSLIT.CC время от времени формирует партнерские отношения или альянсы с некоторыми поставщиками, чтобы облегчить предоставление вам этих продуктов и услуг по переводу и транслитерации. Любое представление или любая информация о гарантии в отношении продуктов или услуг этих третьих лиц, рекламируемых/упоминаемых на нашем сайте (-ах), предоставляется соответствующими третьими лицами, и они несут за это единоличную ответственность. TRANSLIT.CC не несет ответственности перед вами или какой-либо третьей стороной по любым претензиям, вытекающим из таких сторонних продуктов и услуг или в связи с ними. Настоящим вы отказываетесь от любых прав и требований, которые вы можете иметь против TRANSLIT.CC в отношении сторонних продуктов и услуг, в максимальной степени, разрешенной законом.

pyspellchecker · PyPI

Проверка орфографии Pure Python на основе Питера Сообщение в блоге Norvig о настройке простой алгоритм проверки орфографии.

Используется расстояние Левенштейна алгоритм для поиска перестановок в пределах расстояния редактирования 2 от оригинальное слово. Затем он сравнивает все перестановки (вставки, удаления, замены и транспозиции) на известные слова в словесной частоте список. Те слова, которые чаще всего встречаются в частотном списке, скорее правильные результаты.

pyspellchecker поддерживает несколько языков, включая английский, испанский, немецкий, французский и португальский. Для получения информации о том, как словари созданы и как их можно обновить и улучшить, см. Создание и обновление словаря раздела readme!

pyspellchecker поддерживает Python 3

pyspellchecker позволяет настроить расстояние Левенштейна (до двух) для проверки. Для более длинных слов настоятельно рекомендуется использовать расстояние 1, а не по умолчанию 2. См. краткое руководство, чтобы узнать, как можно изменить параметр расстояния.

Установка

Самый простой способ установки — использовать pip:

.
 pip установить pyspellchecker 

Для сборки из исходников:

клон
 git https://github.com/barrust/pyspellchecker.git
cd pyspellchecker
Python -m сборка 

Для поддержки python 2.7 установите выпуск 0.5.6 но обратите внимание, что никакие будущие обновления не будут поддерживать python 2 .

 pip установить pyspellchecker == 0.5.6 

Быстрый старт

После установки использование pyspellchecker должно быть довольно простым вперед:

 из импорта проверки орфографии SpellChecker
заклинание = Проверка орфографии ()
# найти те слова, которые могут быть написаны с ошибками
с опечаткой = заклинание.неизвестно (['что-то', 'есть', 'происходит', 'здесь'])
для слова с ошибкой:
    # Получить один «наиболее вероятный» ответ
    печать (орфография. исправление (слово))
    # Получить список «вероятных» вариантов
    печать (заклинание.кандидаты (слово)) 

Если список частот слов вам не нравится, вы можете добавить дополнительные текст, чтобы создать более подходящий список для вашего варианта использования.

 из импорта проверки орфографии SpellChecker
Spell = SpellChecker() # загружает список частот слов по умолчанию
заклинание.word_frequency.load_text_file('./my_free_text_doc.txt')
# если я просто хочу убедиться, что некоторые слова не помечены как написанные с ошибками
spell.word_frequency.load_words(['Microsoft', 'Apple', 'Google'])
spell.known(['microsoft', 'google']) # теперь вернет и то, и другое! 

Если слова, которые вы хотите проверить, длинные, рекомендуется уменьшить расстояние к 1. Это можно сделать либо при инициализации заклинания проверить класс или постфактум.

 из импорта проверки орфографии SpellChecker
Spell = SpellChecker(distance=1) # устанавливается при инициализации
# поработайте над более длинными словами
Spell.distance = 2 # вернуть параметру расстояния значение по умолчанию 

Неанглийские словари

pyspellchecker поддерживает несколько словарей по умолчанию как часть стандартного упаковка. Каждый из них прост в использовании при инициализации словаря:

 из импорта проверки орфографии SpellChecker
english = SpellChecker() # по умолчанию английский (language='en')
spanish = SpellChecker(language='es') # используйте словарь испанского языка
russian = SpellChecker(language='ru') # использовать русский словарь
arabic = SpellChecker(language='ar') # используйте словарь арабского языка 

В настоящее время поддерживаются следующие словари:

  • Английский – «en»

  • Испанский – «es»

  • Французский – «fr»

  • Португальский – ‘pt’

  • Немецкий – «de»

  • Русский – «ru»

  • Арабский – «ар»

Создание и обновление словаря

Создание словарей, к сожалению, не точная наука. Я предоставил сценарий, который с учетом текстового файла предложений (в данном случае из OpenSubtitles), он сгенерирует список частоты слов на основе слов, найденных в тексте. Затем сценарий пытается выполнить *очистить* частотность слов, например, удалив слова с недопустимыми символами (обычно из других языков), удалив термины с малым количеством слов (орфографические ошибки?) и попытавшись применить доступные правила (не более одного ударения в слове в Испанский). Затем он удаляет слова из списка известных слов, которые должны быть удалены. Затем он добавляет в словарь слова, которые, как известно, отсутствуют или были удалены из-за слишком низкой частоты.

Сценарий можно найти здесь: scripts/build_dictionary.py`. Исходный список частот слов, полученный из OpenSubtitles, можно найти в папке `scripts/data/` вместе с 9 параметрами для каждого языка.0222 включает и исключает текстовые файлы.

Очень желательна любая помощь в обновлении и поддержании словарей. Для этого можно начать обсуждение на GitHub или добавить запросы на обновление файлов включения и исключения.

Дополнительные методы

Доступна онлайновая документация; ниже приведена версия некоторых доступных функций в виде заметок:

коррекция(слово): Возвращает наиболее вероятный результат для слово с ошибкой

кандидатов(слово): Возвращает набор возможных кандидатов для слово с ошибкой

known([words]): возвращает те слова, которые входят в частоту слова список

unknown([words]): Возвращает те слова, которые не входят в частоту список

word_probability(word): Частота данного слова среди всех слов в частотном списке

Следующие данные вряд ли потребуются пользователю, но доступны:

edit_distance_1(word): возвращает набор всех строк на уровне Левенштейна. Расстояние одного на основе алфавита выбранного языка

edit_distance_2(word): возвращает набор всех строк на уровне Левенштейна. Расстояние два на основе алфавита выбранного языка

Кредиты

  • Запись в блоге Питера Норвига о настройке простого алгоритма проверки орфографии

  • П.

Оставить комментарий