Skip to content

sitemap.xml генерируется не полностью валидным #3

@rb2

Description

@rb2

По спецификации http://www.sitemaps.org/protocol.html#escaping некоторые символы должны escape-иться, даже в URL. Т.е. например URI http://abc.org/monitor-14" в XML должен выглядеть не как http://abc.org/monitor-14%22 (rawurlencode), а как http://abc.org/monitor-14"

Гугл соответственно должен это получить в "xml-обертке", декодировать и опрашивать правильные линки (rawurlencode). Оказалось, он этого не делает. Запрашивает адреса вида http://abc.org/monitor-14" и получает 404 в ответ.

Резюме:

  1. В гугле глюк. И надо либо им сообщать, либо иметь в виду и обходить (не допускать применение потенциальных глюко-символов)
  2. В Опенкарте/ocStore тоже не всё хорошо при генерации sitemap.xml, поскольку искейпится только amp

TODO:

  1. генератор sitemap - надо добавить остальные сущности
  2. валидаторы SEO Keywords в админке - надо бы добавить замену "глюкоопасных" символов, чтобы они в URI вообще не попадали в базу и исправлялись на лету. И соответственно в SE они тоже никогда не попадут
    • А заодно добавить бы туда проверку на уникальность SEO Keyword
    • если (2) реализовать, то (1) можно оставить нетронутым

Metadata

Metadata

Assignees

No one assigned

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions