Skip to content
Open
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
22 changes: 22 additions & 0 deletions tasks/muhammadkhon_i_max_matrix_elem/common/include/common.hpp
Original file line number Diff line number Diff line change
@@ -0,0 +1,22 @@
#pragma once

#include <string>
#include <tuple>
#include <vector>

#include "task/include/task.hpp"

namespace muhammadkhon_i_max_matrix_elem {

struct Matrix {
std::vector<int> data;
int rows;
int columns;
};

using InType = Matrix;
using OutType = int;
using TestType = std::tuple<int, std::string>;
using BaseTask = ppc::task::Task<InType, OutType>;

} // namespace muhammadkhon_i_max_matrix_elem
9 changes: 9 additions & 0 deletions tasks/muhammadkhon_i_max_matrix_elem/info.json
Original file line number Diff line number Diff line change
@@ -0,0 +1,9 @@
{
"student": {
"first_name": "Исрам",
"last_name": "Мухаммадхон",
"middle_name": "Абдулманон",
"group_number": "3823Б1ПР5",
"task_number": "13"
}
}
22 changes: 22 additions & 0 deletions tasks/muhammadkhon_i_max_matrix_elem/mpi/include/ops_mpi.hpp
Original file line number Diff line number Diff line change
@@ -0,0 +1,22 @@
#pragma once

#include "muhammadkhon_i_max_matrix_elem/common/include/common.hpp"
#include "task/include/task.hpp"

namespace muhammadkhon_i_max_matrix_elem {

class MuhammadkhonIMaxMatrixElemMPI : public BaseTask {
public:
static constexpr ppc::task::TypeOfTask GetStaticTypeOfTask() {
return ppc::task::TypeOfTask::kMPI;
}
explicit MuhammadkhonIMaxMatrixElemMPI(const InType &in);

private:
bool ValidationImpl() override;
bool PreProcessingImpl() override;
bool RunImpl() override;
bool PostProcessingImpl() override;
};

} // namespace muhammadkhon_i_max_matrix_elem
87 changes: 87 additions & 0 deletions tasks/muhammadkhon_i_max_matrix_elem/mpi/src/ops_mpi.cpp
Original file line number Diff line number Diff line change
@@ -0,0 +1,87 @@
#include "muhammadkhon_i_max_matrix_elem/mpi/include/ops_mpi.hpp"

#include <mpi.h>

#include <algorithm>
#include <cstddef>
#include <limits>
#include <vector>

#include "muhammadkhon_i_max_matrix_elem/common/include/common.hpp"

namespace muhammadkhon_i_max_matrix_elem {

MuhammadkhonIMaxMatrixElemMPI::MuhammadkhonIMaxMatrixElemMPI(const InType &in) {
SetTypeOfTask(GetStaticTypeOfTask());
GetInput() = in;
GetOutput() = 0;
}

bool MuhammadkhonIMaxMatrixElemMPI::ValidationImpl() {
const Matrix &inputdata = GetInput();
const int rows = inputdata.rows;
const int columns = inputdata.columns;
const std::vector<int> &matrix = inputdata.data;

return !matrix.empty() && rows > 0 && columns > 0 &&
matrix.size() == static_cast<size_t>(rows) * static_cast<size_t>(columns);
}

bool MuhammadkhonIMaxMatrixElemMPI::PreProcessingImpl() {
return true;
}

bool MuhammadkhonIMaxMatrixElemMPI::RunImpl() {
const Matrix &inputdata = GetInput();
const int rows = inputdata.rows;
const int columns = inputdata.columns;
const std::vector<int> &matrix = inputdata.data;

if (matrix.empty()) {
GetOutput() = 0;
return true;
}

int rank = 0;
int size = 1;
MPI_Comm_size(MPI_COMM_WORLD, &size);
MPI_Comm_rank(MPI_COMM_WORLD, &rank);

const int rows_at_one_process = rows / size;
const int remaining_rows = rows % size;
std::vector<int> counts_per_process(size, rows_at_one_process * columns);
std::vector<int> displacements(size, 0);

if (remaining_rows != 0) {
for (int process_index = 0; process_index < remaining_rows; ++process_index) {
counts_per_process[process_index] += columns;
}
}
for (int process_index = 1; process_index < size; ++process_index) {
displacements[process_index] = displacements[process_index - 1] + counts_per_process[process_index - 1];
}

std::vector<int> recvbuf(counts_per_process[rank]);
MPI_Scatterv(matrix.data(), counts_per_process.data(), displacements.data(), MPI_INT, recvbuf.data(),
counts_per_process[rank], MPI_INT, 0, MPI_COMM_WORLD);

int local_max = std::numeric_limits<int>::min();
if (!recvbuf.empty()) {
local_max = recvbuf[0];
for (size_t index = 1; index < recvbuf.size(); ++index) {
local_max = std::max(local_max, recvbuf[index]);
}
}

int global_max = 0;
MPI_Allreduce(&local_max, &global_max, 1, MPI_INT, MPI_MAX, MPI_COMM_WORLD);

GetOutput() = global_max;
return true;
}

bool MuhammadkhonIMaxMatrixElemMPI::PostProcessingImpl() {
return true;
}

} // namespace muhammadkhon_i_max_matrix_elem
151 changes: 151 additions & 0 deletions tasks/muhammadkhon_i_max_matrix_elem/report.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,151 @@
- Student: <Мухаммадхон Исрам Абдулманон>, group <3823Б1ПР5>
- Technology: <SEQ | MPI>
- Variant: <13>

## 1. Introduction
МОТИВАЦИЯ -> Ускорение поиска максимально элемента в матрицах большого размера,за счёт распределения нагрузки по нескольким процесам
ПРОБЛЕМА -> Матрицы большого размера могут очень долго обрабатываться
РЕЗУЛЬТАТ -> Ускорение производительности.

## 2. Problem Statement
Formal task definition -> для матрицы размером A[a1,b1] найти максимальный элемент
input/output format -> на вход подаётся Matrix(тоесть данные матрицы), на выход подаётся 1 int значение, которое является максимумом в матрице
constraints -> a1,b1 > 0, matrix.size() = a1 * b1.

## 3. Baseline Algorithm (Sequential)
Describe the base algorithm with enough detail to reproduce.

```cpp
int max_value = matrix[0];
for (size_t i = 1; i < matrix.size(); i++) {
max_value = std::max(max_value, matrix[i]);
}
GetOutput() = max_value;
```

## 4. Parallelization Scheme
data distribution:
Блочное распределение по строкам
Балансировка нагрузки при неравномерном распределении
, communication pattern:
```cpp
//распределение данных
MPI_Scatterv(matrix.data(), how_many_to_one_proces.data(), offset.data(), MPI_INT, recvbuf.data(),
how_many_to_one_proces[rank], MPI_INT, 0, MPI_COMM_WORLD);
//поиск локального максимума
int local_max;
if (!recvbuf.empty()) {
local_max = recvbuf[0];
for (size_t i = 1; i < recvbuf.size(); i++) {
local_max = std::max(local_max, recvbuf[i]);
}
} else {
local_max = 0;
}
//поиск глобального максимума
int global_max;
MPI_Allreduce(&local_max, &global_max, 1, MPI_INT, MPI_MAX, MPI_COMM_WORLD);
```
rank roles.
Rank 0 - распределение задач
Rank all - локальные вычисления и участие в редукции


## 5. Implementation Details
- Code structure (files, key classes/functions)
common - общие структуры данных
mpi - паралельная реализация mpi
seq - последовательная
test - тесты функцианальности и производительности

```cpp
class MuhammadkhonIMaxMatrixElemSEQ : public BaseTask {
public:
static constexpr ppc::task::TypeOfTask GetStaticTypeOfTask() {
return ppc::task::TypeOfTask::kSEQ;
}
explicit MuhammadkhonIMaxMatrixElemSEQ(const InType &in);

private:
bool ValidationImpl() override;
bool PreProcessingImpl() override;
bool RunImpl() override;
bool PostProcessingImpl() override;
};
```
```cpp
class MuhammadkhonIMaxMatrixElemMPI : public BaseTask {
public:
static constexpr ppc::task::TypeOfTask GetStaticTypeOfTask() {
return ppc::task::TypeOfTask::kMPI;
}
explicit MuhammadkhonIMaxMatrixElemMPI(const InType &in);

private:
bool ValidationImpl() override;
bool PreProcessingImpl() override;
bool RunImpl() override;
bool PostProcessingImpl() override;
};

```
```cpp
struct Matrix {
std::vector<int> data;
int rows;
int columns;
};
```
- Important assumptions and corner cases
1- матрица не должна быть пустой
2- размер матрицы должен соответствовать rows*columns
3- возращает 1 элемент(максимально значение в матрице)
- Memory usage considerations
1- в mpi каждый процесс имеет только свои значения


## 6. Experimental Setup
- ОЗУ: 8 Гб
- ОС: Linux Fedora
- Архитектура: x64

- Язык программирования: C++
- Библиотека для параллельного программирования: MPI
- Компилятор MSCV
- Тип сборки: Release

## 7. Results and Discussion

### 7.1 Correctness
Размер матрицы был 4000x4000
Было произведено 4 запуска
В каждом из запусков MPI оказалось эффективнее SEQ

### 7.2 Performance
Present time, speedup and efficiency. Example table:

| Mode | processes | AvgTime(s) | Speedup | Efficiency |
|-------------|-----------|------------|---------|------------|
| seq | 1 | 0.09386 | 1.00 | N/A |
| mpi | 2 | 0.06325 | 1.48 | 74.0% |
| mpi | 4 | 0.04038 | 2.32 | 58.0% |
| mpi | 6 | 0.04205 | 2.23 | 37.2% |
| mpi | 8 | 0.03589 | 2.62 | 32.7% |


## 8. Conclusions
ВЫВОД :использование mpi показало свою эффективность, ускорив работу в 2.32 раза в среднем
таким образом можно сделать вывод, что распределение нагрузки на несколько процессов является
максимально эффективным метод работы с большим количеством данных
Также можно заметить, что на 6 процессах время выполнения больше чем на 4, это может быть связано
с тем, что распределение проверяемой матрицы получилось не равномерным.
Наибольшая эффективность достигается на 2 процессах, однако максимальное абсолютное ускорение на 8 процессах
Ограничения: если матрицы маленькие, то mpi является неэффективным методом работы
Следовательно использование MPI является эффективным в условиях больших матриц когда комуникация между процессами
не затратит времени больше, чем сама работа с данными

## 9. References
MICROSOFT MPI - https://learn.microsoft.com/ru-ru/message-passing-interface/microsoft-mpi
Parallel Programming Course - https://learning-process.github.io/parallel_programming_course/ru/index.html
Parallel Programming 2025-2026 - https://disk.yandex.ru/d/NvHFyhOJCQU65w
stack overflow - https://stackoverflow.com/questions
22 changes: 22 additions & 0 deletions tasks/muhammadkhon_i_max_matrix_elem/seq/include/ops_seq.hpp
Original file line number Diff line number Diff line change
@@ -0,0 +1,22 @@
#pragma once

#include "muhammadkhon_i_max_matrix_elem/common/include/common.hpp"
#include "task/include/task.hpp"

namespace muhammadkhon_i_max_matrix_elem {

class MuhammadkhonIMaxMatrixElemSEQ : public BaseTask {
public:
static constexpr ppc::task::TypeOfTask GetStaticTypeOfTask() {
return ppc::task::TypeOfTask::kSEQ;
}
explicit MuhammadkhonIMaxMatrixElemSEQ(const InType &in);

private:
bool ValidationImpl() override;
bool PreProcessingImpl() override;
bool RunImpl() override;
bool PostProcessingImpl() override;
};

} // namespace muhammadkhon_i_max_matrix_elem
53 changes: 53 additions & 0 deletions tasks/muhammadkhon_i_max_matrix_elem/seq/src/ops_seq.cpp
Original file line number Diff line number Diff line change
@@ -0,0 +1,53 @@
#include "muhammadkhon_i_max_matrix_elem/seq/include/ops_seq.hpp"

#include <algorithm>
#include <cstddef>
#include <vector>

#include "muhammadkhon_i_max_matrix_elem/common/include/common.hpp"

namespace muhammadkhon_i_max_matrix_elem {

MuhammadkhonIMaxMatrixElemSEQ::MuhammadkhonIMaxMatrixElemSEQ(const InType &in) {
SetTypeOfTask(GetStaticTypeOfTask());
GetInput() = in;
GetOutput() = 0;
}

bool MuhammadkhonIMaxMatrixElemSEQ::ValidationImpl() {
const Matrix &inputdata = GetInput();
const int rows = inputdata.rows;
const int columns = inputdata.columns;
const std::vector<int> &matrix = inputdata.data;

return !matrix.empty() && rows > 0 && columns > 0 &&
matrix.size() == static_cast<size_t>(rows) * static_cast<size_t>(columns);
}

bool MuhammadkhonIMaxMatrixElemSEQ::PreProcessingImpl() {
return true;
}

bool MuhammadkhonIMaxMatrixElemSEQ::RunImpl() {
const Matrix &inputdata = GetInput();
const std::vector<int> &matrix = inputdata.data;

if (matrix.empty()) {
GetOutput() = 0;
return true;
}

int max_value = matrix[0];
for (size_t index = 1; index < matrix.size(); ++index) {
max_value = std::max(max_value, matrix[index]);
}

GetOutput() = max_value;
return true;
}

bool MuhammadkhonIMaxMatrixElemSEQ::PostProcessingImpl() {
return true;
}

} // namespace muhammadkhon_i_max_matrix_elem
7 changes: 7 additions & 0 deletions tasks/muhammadkhon_i_max_matrix_elem/settings.json
Original file line number Diff line number Diff line change
@@ -0,0 +1,7 @@
{
"tasks_type": "processes",
"tasks": {
"mpi": "enabled",
"seq": "enabled"
}
}
13 changes: 13 additions & 0 deletions tasks/muhammadkhon_i_max_matrix_elem/tests/.clang-tidy
Original file line number Diff line number Diff line change
@@ -0,0 +1,13 @@
InheritParentConfig: true

Checks: >
-modernize-loop-convert,
-cppcoreguidelines-avoid-goto,
-cppcoreguidelines-avoid-non-const-global-variables,
-misc-use-anonymous-namespace,
-modernize-use-std-print,
-modernize-type-traits

CheckOptions:
- key: readability-function-cognitive-complexity.Threshold
value: 50 # Relaxed for tests
Loading
Loading