Skip to content

Conversation

@dalt74
Copy link

@dalt74 dalt74 commented Apr 5, 2018

Changes by @Outlingo

@socketpair socketpair force-pushed the master branch 3 times, most recently from e3529cd to 6e2659a Compare May 2, 2018 11:06
данные используемых разделов, а вот неиспользуемые можно шатать как угодно.
#. Перед извлечением диска физически на лету выполнить:
``echo 1 > /sys/block/{data-disk}/device/delete``.
Но это не обязательно. Вменяемое железо через несколько секунд поймёт,
Copy link
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Не вот нет. Эта команда профлушивает буферы перед изыманием. И если этого не сделать, то иногда остается /dev/sdX но с ним ничего сделать нельзя, всегда ио еррор. Любое железо понимает это мгновенно, но линукс иногда охреневает с этого. И да, не везде на самом деле есть сата хотплуг.

#. ``partprobe /dev/{journal-disk}``. fdisk не умеет говорить ядру о применении
измененной таблицы разделов если диск используется (например, под другие
журналы/бд на этом же диске.
#. Но лучше использовать gdisk. Тогда в принципе не получится поменять
Copy link
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

ты наверно с партед перепутал ?

#. Если выносной журнал/бд: ``fdisk /dev/{journal-disk}``, удалить
соответствующий раздел. Современный fdisk умеет работать с GPT.
какой именно раздел -- см. сохранённый вывод ``readlink``.
#. ``partprobe /dev/{journal-disk}``. fdisk не умеет говорить ядру о применении
Copy link
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

туду: написать что эта тулза из комплекта партед

"start from root via host" правилами.
* При потере журнала вседиски на него зааттаченные превращаются в труху. На самом деле это не совсем
так, и можно пересоздать журнал, но при этом все копии PG на этой OSD будут оставшими, и предстоит
рекавер и обязательный scrub/deep scrub.
Copy link
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Но жто ж по времени и смыслу тоже самое что перебекфилл этого осд. не так ли? так зачем нужен осд у которого все обжекты устарели ? ну только для кейса когда запись и чтение отличаются по времени или когда это единственная сохранившаяся копия.

названием "вероятность отказа диска" и "время восстановления избыточности". Поскольку данные
размазанны более-менее равномерно, это приводит к тому, что при отказе двух дисков случается
гарантированная потеря данных, а если у вас более 500 дисков, вероятность отказа второго диска
когда первый ещё не отрекаверился заметно больше ноля. Поэтому совсем большие пулы "на весь кластер"
Copy link
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

не понял как количество реплик связано с масштабом размазывания.

* Отключить оффлоадинг (и как проверить помогло ли) - меряем RTT внутри TCP.
* джамбофреймы могут помочь но не особо. сложности со свичами обычно.
* мониторить состояние линка. оно иногда самопроизвольно падает с гигабита на 100 мегабит.
* мониторить состояние линка. оно иногда самопроизвольно падает с гигабита на 100 мегабит. Но это проблема
Copy link
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

поэтому и нужно мониторить. и да, линк пропадает по причине говнопроводов например. Выпиливай.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants