VoIP-Signal-Quality-Analysis/GenCSV.py at main · atulakella/VoIP-Signal-Quality-Analysis · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
import pandas as pd
import numpy as np
from datetime import datetime, timedelta

# Function to generate synthetic VOIP call data
def generate_voip_data(num_entries=200):
    np.random.seed(42)  # For reproducibility

    # Generate random timestamps
    start_time = datetime(2024, 8, 8, 10, 0, 0)
    timestamps = [start_time + timedelta(seconds=i) for i in range(num_entries)]
    # Generate synthetic data for other columns
    source_ips = ['192.168.1.10'] * num_entries
    destination_ips = ['192.168.1.20'] * num_entries
    packet_sizes = np.random.randint(140, 160, size=num_entries)  # Packet size between 140 and 160 bytes
    jitters = np.random.randint(20, 100, size=num_entries)  # Jitter between 5 and 30 ms
    latencies = np.random.randint(160, 250, size=num_entries)  # Latency between 15 and 40 ms
    packet_losses = np.random.uniform(0, 2, size=num_entries)  # Packet loss between 0% and 1%
    # Create DataFrame
    df = pd.DataFrame({
        'Timestamp': timestamps,
        'Source IP': source_ips,
        'Destination IP': destination_ips,
        'Packet Size (Bytes)': packet_sizes,
        'Jitter (ms)': jitters,
        'Latency (ms)': latencies,
        'Packet Loss (%)': packet_losses
    })

    # Calculate additional metrics
    df['Call Duration (s)'] = 1  # Assuming 1-second duration for simplicity
    df['SNR'] = np.random.uniform(10, 30, size=num_entries)  # Random SNR between 10 and 30 dB

    # Calculate R-factor components
    df['Is'] = 1.5 * df['Packet Loss (%)']
    df['Id'] = df['Jitter (ms)'].apply(lambda x: 0.5 if 30 <= x < 60 else (1 if x >= 60 else 0))
    df['Ie'] = (df['Latency (ms)'] - 150) / 10
    df['R-factor'] = 93.2 - df['Is'] - df['Id'] - df['Ie']

    return df

# Generate the dataset
df = generate_voip_data()
# Optionally, save the dataset to a CSV file
df.to_csv('voip_calls_dataset.csv', index=False)
# Display the first few rows of the dataset
print(df.head())