信号処理をするにはDSPライブラリがあると大変ありがたい,というか必須かもしれない.ESP32ではどうなっているのか調べると,Espressif DSP Library があり一通りメジャーな処理は用意されている.ただ,Arduino IDE で使えるかどうかが問題.
ESP32のボードマネージャがインストールされたフォルダを調べてみると,かなり深い階層の非常に見つけ難いところに,ヘッダファイル(esp_dsp.h)が置かれていた.どうやらソースコードはないがライブラリも入っている様子.
試しに,IIRフィルタ(2次LPF)を実装してみた. コードを下に示す.前回からに変更部分はハイライト表示してある.
// I2S on ESP32-S3
// T.Uebo October 1 , 2022
// I2S Master MODE 48kHz/32bit
//
// Mclk GPIO 0
// Bclk GPIO 42
// LRclk GPIO 2
// Dout GPIO 41
// Din GPIO 1
#include <esp_dsp.h>
#include <driver/i2s.h>
#define fsample 48000
#define BLOCK_SAMPLES 64
#define MUTE 40 // MUTE control (LOW: Mute)
//buffers
int rxbuf[BLOCK_SAMPLES*2], txbuf[BLOCK_SAMPLES*2];
float Lch_in[BLOCK_SAMPLES], Rch_in[BLOCK_SAMPLES];
float Lch_out[BLOCK_SAMPLES], Rch_out[BLOCK_SAMPLES];
// for IIR Filter
float zL0[2], zR0[2];
float coeffs[5];
/*-----------------------------------------------------------------------------------------------
Setup
-------------------------------------------------------------------------------------------------*/
void setup(void) {
Serial.begin(115200);
delay(50);
//Mute Control
pinMode(MUTE, OUTPUT);
digitalWrite(MUTE, HIGH); //unmute
pinMode(48, OUTPUT);
// set IIR Filter Coeffs.(as LPF)
dsps_biquad_gen_lpf_f32(coeffs, 0.01f, 1.0f); // fc = 0.01*fsample[Hz], Q=1.0
// I2S setup ------------------------------------------------------------
i2s_config_t i2s_config = {
.mode = (i2s_mode_t)(I2S_MODE_MASTER | I2S_MODE_TX | I2S_MODE_RX),
.sample_rate = fsample,
.bits_per_sample = (i2s_bits_per_sample_t)32,
.channel_format = I2S_CHANNEL_FMT_RIGHT_LEFT,
.communication_format = (i2s_comm_format_t)(I2S_COMM_FORMAT_STAND_I2S),
.intr_alloc_flags = 0,
.dma_buf_count = 6,
.dma_buf_len = BLOCK_SAMPLES*4,
.use_apll = false,
.tx_desc_auto_clear = true,
.fixed_mclk = 0,
};
i2s_driver_install( I2S_NUM_0, &i2s_config, 0, NULL);
i2s_pin_config_t pin_config = {
.bck_io_num = 42,
.ws_io_num = 2,
.data_out_num = 41,
.data_in_num = 1
};
i2s_set_pin( I2S_NUM_0, &pin_config);
}
/*-----------------------------------------------------------------------------------------------
Signal Process Loop
-------------------------------------------------------------------------------------------------*/
void loop(void) {
size_t readsize = 0;
//Input from I2S codec
esp_err_t rxfb = i2s_read(I2S_NUM_0, &rxbuf[0], BLOCK_SAMPLES*2*4, &readsize, portMAX_DELAY);
if (rxfb == ESP_OK && readsize==BLOCK_SAMPLES*2*4) {
digitalWrite(48, HIGH);
int j=0;
for (int i=0; i<BLOCK_SAMPLES; i++) {
Lch_in[i] = (float) rxbuf[j];
Rch_in[i] = (float) rxbuf[j+1];
j+=2;
}
//-------Signal process -------------------------------
//IIR Filter
dsps_biquad_f32(Lch_in, Lch_out, BLOCK_SAMPLES, coeffs, zL0);
dsps_biquad_f32(Rch_in, Rch_out, BLOCK_SAMPLES, coeffs, zR0);
//------------------------------------------------------
//Output to I2S codec
j=0;
for (int i=0; i<BLOCK_SAMPLES; i++) {
txbuf[j] = (int) Lch_out[i];
txbuf[j+1] = (int) Rch_out[i];
j+=2;
}
i2s_write( I2S_NUM_0, &txbuf[0], BLOCK_SAMPLES*2*4, &readsize, portMAX_DELAY);
}
digitalWrite(48, LOW);
}
I2Sで24bit整数データを取得し,float 32bit で処理しそれを24bit整数にしてI2Sで出力. これであっさり動作した.float で処理できるのはオーバーフローを気にしなくていいので助かる. 係数生成用の関数も用意されていて動的にパラメータを変えていくような時には便利.自分で作っても大した手間ではないが(Teensyのときはそうした). 高次のチェビシェフとかの係数は作れない.そういう場合も含めてフィルタ設計にはOctave が便利なので普段はそちらを常用している.
信号処理量の限界を知るために,GPIO48 に信号処理中はHIGHそれ以外はLOWを出力するようにしてその信号を観測してみた. (GPIO48 はオンボードのRGB LEDに接続されているので信号によってLEDの状態も変化するが,LED制御用の信号ではないのでLEDがどうなるかは不定)
IIR Biquad フィルタがLch,Rch それぞれ1段なので,処理にかかる時間の割合は非常に小さい.ただHIGHのところが一定でないようなので,拡大すると下のようになっていた.
どうも4ブロック分連続して処理するようになっているらしい.理由はI2Sドライバのソースコードがないのでよくわからない(見てもわからないか…).そういうものとして理解しておこう.
次に,信号処理を限界まで追加してみる. Lch,Rch それぞれに 512Tap の FIR + 10段のIIR Biquad を設定した. IIRフィルタの係数はL,R同じ. コードは以下のとおり.
// I2S on ESP32-S3
// T.Uebo October 4, 2022
// I2S Master MODE 48kHz/32bit
//
// Mclk GPIO 0
// Bclk GPIO 42
// LRclk GPIO 2
// Dout GPIO 41
// Din GPIO 1
#include <esp_dsp.h>
#include <driver/i2s.h>
#define fsample 48000
#define BLOCK_SAMPLES 64
#define MUTE 40 // MUTE control (LOW: Mute)
//buffers
int rxbuf[BLOCK_SAMPLES*2], txbuf[BLOCK_SAMPLES*2];
float Lch_in[BLOCK_SAMPLES], Rch_in[BLOCK_SAMPLES];
float Lch_out[BLOCK_SAMPLES], Rch_out[BLOCK_SAMPLES];
// for IIR Filter
float zL0[2], zR0[2], coeffs0[5]; // Z^-1配列(Lch),Z^-1配列 (Rch),係数
float zL1[2], zR1[2], coeffs1[5];
float zL2[2], zR2[2], coeffs2[5];
float zL3[2], zR3[2], coeffs3[5];
float zL4[2], zR4[2], coeffs4[5];
float zL5[2], zR5[2], coeffs5[5];
float zL6[2], zR6[2], coeffs6[5];
float zL7[2], zR7[2], coeffs7[5];
float zL8[2], zR8[2], coeffs8[5];
float zL9[2], zR9[2], coeffs9[5];
// for FIR filter
#define Nfir 512
fir_f32_t firL_st, firR_st; // FIRではワーク用の構造体を用意する必要がある
float coeffs_firL[Nfir], coeffs_firR[Nfir]; // 係数用配列
float z_firL[Nfir], z_firR[Nfir]; // Z^-1配列
/*-----------------------------------------------------------------------------------------------
Setup
-------------------------------------------------------------------------------------------------*/
void setup(void) {
Serial.begin(115200);
delay(50);
//Mute Control
pinMode(MUTE, OUTPUT);
digitalWrite(MUTE, HIGH); //unmute
pinMode(48, OUTPUT);
// I2S setup ------------------------------------------------------------
i2s_config_t i2s_config = {
.mode = (i2s_mode_t)(I2S_MODE_MASTER | I2S_MODE_TX | I2S_MODE_RX),
.sample_rate = fsample,
.bits_per_sample = (i2s_bits_per_sample_t)32,
.channel_format = I2S_CHANNEL_FMT_RIGHT_LEFT,
.communication_format = (i2s_comm_format_t)(I2S_COMM_FORMAT_STAND_I2S),
.intr_alloc_flags = 0,
.dma_buf_count = 6,
.dma_buf_len = BLOCK_SAMPLES*4,
.use_apll = false,
.tx_desc_auto_clear = true,
.fixed_mclk = 0,
};
i2s_driver_install( I2S_NUM_0, &i2s_config, 0, NULL);
i2s_pin_config_t pin_config = {
.bck_io_num = 42,
.ws_io_num = 2,
.data_out_num = 41,
.data_in_num = 1
};
i2s_set_pin( I2S_NUM_0, &pin_config);
//-- Filter settings -------------------------------------
// IIR Filter の係数を生成
dsps_biquad_gen_lpf_f32(coeffs0, 0.45f, 1.0f);
dsps_biquad_gen_lpf_f32(coeffs1, 0.45f, 1.0f);
dsps_biquad_gen_lpf_f32(coeffs2, 0.45f, 1.0f);
dsps_biquad_gen_lpf_f32(coeffs3, 0.45f, 1.0f);
dsps_biquad_gen_lpf_f32(coeffs4, 0.45f, 1.0f);
dsps_biquad_gen_lpf_f32(coeffs5, 0.45f, 1.0f);
dsps_biquad_gen_lpf_f32(coeffs6, 0.45f, 1.0f);
dsps_biquad_gen_lpf_f32(coeffs7, 0.45f, 1.0f);
dsps_biquad_gen_lpf_f32(coeffs8, 0.45f, 1.0f);
dsps_biquad_gen_lpf_f32(coeffs9, 0.45f, 1.0f);
// FIR構造体の初期化
dsps_fir_init_f32(&firL_st, coeffs_firL, z_firL, Nfir);
dsps_fir_init_f32(&firR_st, coeffs_firR, z_firR, Nfir);
// FIR Filter の係数を生成.
dsps_d_gen_f32(coeffs_firL, Nfir, 0); // 係数列の先頭を1,その他0
dsps_d_gen_f32(coeffs_firR, Nfir, Nfir-1); // 係数列の最後1,その他0
}
/*-----------------------------------------------------------------------------------------------
Signal Process Loop
-------------------------------------------------------------------------------------------------*/
void loop(void) {
size_t readsize = 0;
//Input from I2S codec
esp_err_t rxfb = i2s_read(I2S_NUM_0, &rxbuf[0], BLOCK_SAMPLES*2*4, &readsize, portMAX_DELAY);
if (rxfb == ESP_OK && readsize==BLOCK_SAMPLES*2*4) {
digitalWrite(48, HIGH);
int j=0;
for (int i=0; i<BLOCK_SAMPLES; i++) {
Lch_in[i] = (float) rxbuf[j];
Rch_in[i] = (float) rxbuf[j+1];
j+=2;
}
//-------Signal process -------------------------------
dsps_biquad_f32(Lch_in, Lch_out, BLOCK_SAMPLES, coeffs0, zL0);
dsps_biquad_f32(Rch_in, Rch_out, BLOCK_SAMPLES, coeffs0, zR0);
dsps_biquad_f32(Lch_out, Lch_in, BLOCK_SAMPLES, coeffs1, zL1);
dsps_biquad_f32(Rch_out, Rch_in, BLOCK_SAMPLES, coeffs1, zR1);
dsps_biquad_f32(Lch_in, Lch_out, BLOCK_SAMPLES, coeffs2, zL2);
dsps_biquad_f32(Rch_in, Rch_out, BLOCK_SAMPLES, coeffs2, zR2);
dsps_biquad_f32(Lch_out, Lch_in, BLOCK_SAMPLES, coeffs3, zL3);
dsps_biquad_f32(Rch_out, Rch_in, BLOCK_SAMPLES, coeffs3, zR3);
dsps_biquad_f32(Lch_in, Lch_out, BLOCK_SAMPLES, coeffs4, zL4);
dsps_biquad_f32(Rch_in, Rch_out, BLOCK_SAMPLES, coeffs4, zR4);
dsps_biquad_f32(Lch_out, Lch_in, BLOCK_SAMPLES, coeffs5, zL5);
dsps_biquad_f32(Rch_out, Rch_in, BLOCK_SAMPLES, coeffs5, zR5);
dsps_biquad_f32(Lch_in, Lch_out, BLOCK_SAMPLES, coeffs6, zL6);
dsps_biquad_f32(Rch_in, Rch_out, BLOCK_SAMPLES, coeffs6, zR6);
dsps_biquad_f32(Lch_out, Lch_in, BLOCK_SAMPLES, coeffs7, zL7);
dsps_biquad_f32(Rch_out, Rch_in, BLOCK_SAMPLES, coeffs7, zR7);
dsps_biquad_f32(Lch_in, Lch_out, BLOCK_SAMPLES, coeffs8, zL8);
dsps_biquad_f32(Rch_in, Rch_out, BLOCK_SAMPLES, coeffs8, zR8);
dsps_biquad_f32(Lch_out, Lch_in, BLOCK_SAMPLES, coeffs9, zL9);
dsps_biquad_f32(Rch_out, Rch_in, BLOCK_SAMPLES, coeffs9, zR9);
dsps_fir_f32(&firL_st, Lch_in, Lch_out, BLOCK_SAMPLES);
dsps_fir_f32(&firR_st, Rch_in, Rch_out, BLOCK_SAMPLES);
//------------------------------------------------------
//Output to I2S codec
j=0;
for (int i=0; i<BLOCK_SAMPLES; i++) {
txbuf[j] = (int) Lch_out[i];
txbuf[j+1] = (int) Rch_out[i];
j+=2;
}
i2s_write( I2S_NUM_0, &txbuf[0], BLOCK_SAMPLES*2*4, &readsize, portMAX_DELAY);
}
digitalWrite(48, LOW);
}
これでGPIO48の信号を見てみると下のようにほぼ限界になっている.
260μsの隙間があるのでもう少し詰められる.試しのFIRのタップ数を増やしていくと580くらいで出力の音がおかしくなった.
ほぼ予想どおり. これくらいの処理能力ならデシメーション無しでSSBのベースバンド処理はいけそう.エフェクタならFIRは使わないのでかなり余裕をもって使える.