shiguredo-webrtc-build · zztkm · Dec 11, 2025 · Nov 18, 2025 · Nov 18, 2025 · Dec 6, 2025
diff --git a/.github/workflows/build.yml b/.github/workflows/build.yml
@@ -74,7 +74,7 @@ jobs:
     runs-on: macos-26
     steps:
       - uses: actions/checkout@v5
-      - name: Select Xcode 16.1
+      - name: Select Xcode 26.0
         run: sudo xcode-select --switch /Applications/Xcode_26.0.app/Contents/Developer
       - name: Setup Git User
         run: |

diff --git a/CHANGES.md b/CHANGES.md
@@ -29,6 +29,9 @@ VERSION ファイルを上げただけの場合は変更履歴記録は不要。
 
 ## タイムライン
 
+- 2025-12-10 [ADD] iOS SDK 向けに RTCAudioTrackSink を追加する
+  - RTCAudioTrackSink を実装して、RTCAudioTrack に関連付けると音声トラックごとに PCM 音声データを取得することができる
+  - @zztkm
 - 2025-11-13 [RELEASE] m143.7499.1.0
   - @torikizi
 - 2025-11-13 [ADD] windows_fix_adm_device_count.patch を追加して Windows 向け ADM の RecordingDevices() と PlayoutDevices() の返す値を修正する

diff --git a/patches/ios_audio_track_sink.md b/patches/ios_audio_track_sink.md
@@ -0,0 +1,57 @@
+# ios_audio_track_sink.patch の解説
+
+iOS SDK 向けに AudioTrackSink 機能を追加するパッチである `ios_audio_track_sink.patch` についての説明です。ネイティブの `AudioTrackInterface::AddSink()` / `RemoveSink()` を Objective-C / Swift から扱えるようにしています。
+
+## 目的
+
+- iOS 向け libwebrtc で `RTCAudioTrack` から PCM データを取得できる API を追加する
+- 既存の C++ `AudioTrackInterface::AddSink()` と同等の機構を ObjC API として提供し、トラックごとの録音・音量可視化などの用途に活用できるようにする
+
+## 背景
+
+標準の Objective-C SDK では RTCAudioTrack から PCM データを直接取得する手段が用意されていない。一方、C++ では AudioTrackInterface に AddSink() / RemoveSink() が定義されており、AudioTrackSinkInterface を実装することで PCM データを受け取ることができる。そこでこのパッチでは、Objective-C 向けに AudioTrackSinkInterface と同等の役割を果たす RTCAudioTrackSink プロトコルと、C++ とのブリッジ実装を追加する。
+
+## 変更点の概要
+
+- `sdk/objc/api/peerconnection/RTCAudioTrackSink.h` を新規追加し、`onData()` と任意の `preferredNumberOfChannels()` を公開する `RTCAudioTrackSink` プロトコルを定義。
+- `sdk/objc/api/RTCAudioTrackSinkAdapter.mm` と `RTCAudioTrackSinkAdapter+Private.h` を追加し、ObjC の `RTCAudioTrackSink` と C++ の `AudioTrackSinkInterface` を橋渡しするアダプターを実装。
+- `sdk/objc/api/peerconnection/RTCAudioTrack.{h,mm}` に `addSink:` / `removeSink:` を追加し、トラックごとに複数のシンクを登録・解除できるように変更。`dealloc` で全シンクをネイティブ側から解除する処理を追加。
+- `sdk/BUILD.gn` に上記ファイルを登録。
+
+### パッチ実装のポイント
+
+- `AudioTrackSinkAdapter` は `AudioTrackSinkInterface` を実装し、`OnData` で受け取った PCM を `NSData` にコピーして RTCAudioTrackSin の `onData:bitsPerSample:sampleRate:numberOfChannels:numberOfFrames:` に渡す。
+- `RTCAudioTrackSink` に `preferredNumberOfChannels` が実装されていれば `AudioTrackSinkAdapter::NumPreferredChannels()` でその値を返す、実装されていない場合は「指定なし」として `-1` をデフォルトで返す。
+- RTCAudioTrack の `addSink:` は同一の RTCAudioTrackSink インスタンスの重複登録を防ぎ、`removeSink:` は登録済みシンクのみを解除して `AudioTrackSinkInterface` との紐づけを適切に管理する。`dealloc` では残存シンクをすべて解除し、ネイティブ側の参照リークを防ぐ。
+
+## RTCAudioTrackSink の利用例
+
+```swift
+final class AudioLogger: NSObject, RTCAudioTrackSink {
+  func onData(_ audioData: Data,
+              bitsPerSample: Int,
+              sampleRate: Int,
+              numberOfChannels: Int,
+              numberOfFrames: Int) {
+    // audioData は PCM16LE。必要なら別キューへ渡す。
+  }
+
+  func preferredNumberOfChannels() -> Int {
+    // 例: モノラルで受けたい場合。実装しなければ -1 を返すデフォルト実装が使われる。
+    return 1
+  }
+}
+
+let track: RTCAudioTrack = /* MediaStream などから取得 */
+let sink = AudioLogger()
+track.addSink(sink)
+
+// 不要になったら
+track.removeSink(sink)
+```
+
+### RTCAudioTrackSink 利用時の注意点
+
+- `RTCAudioTrackSink` と `RTCAudioTrack` は 1:1 で紐づける運用を推奨。`onData` にトラック識別子が含まれないため、1:N で共有すると呼び出し元トラックを判別できなくなる。
+- コールバックはネイティブ音声スレッドで呼ばれるため、重い処理は別スレッドへ委譲する必要がある。
+
diff --git a/patches/ios_audio_track_sink.patch b/patches/ios_audio_track_sink.patch
@@ -0,0 +1,285 @@
+diff --git a/sdk/BUILD.gn b/sdk/BUILD.gn
+index 7b8a02462c..f61cf30a95 100644
+--- a/sdk/BUILD.gn
++++ b/sdk/BUILD.gn
+@@ -991,12 +991,15 @@ if (is_ios || is_mac) {
+       ]
+       configs += [ "..:no_global_constructors" ]
+       sources = [
++        "objc/api/RTCAudioTrackSinkAdapter+Private.h",
++        "objc/api/RTCAudioTrackSinkAdapter.mm",
+         "objc/api/peerconnection/RTCAudioSource+Private.h",
+         "objc/api/peerconnection/RTCAudioSource.h",
+         "objc/api/peerconnection/RTCAudioSource.mm",
+         "objc/api/peerconnection/RTCAudioTrack+Private.h",
+         "objc/api/peerconnection/RTCAudioTrack.h",
+         "objc/api/peerconnection/RTCAudioTrack.mm",
++        "objc/api/peerconnection/RTCAudioTrackSink.h",
+         "objc/api/peerconnection/RTCCertificate.h",
+         "objc/api/peerconnection/RTCCertificate.mm",
+         "objc/api/peerconnection/RTCConfiguration+Native.h",
+@@ -1389,6 +1392,7 @@ if (is_ios || is_mac) {
+           "objc/helpers/UIDevice+RTCDevice.h",
+           "objc/api/peerconnection/RTCAudioSource.h",
+           "objc/api/peerconnection/RTCAudioTrack.h",
++          "objc/api/peerconnection/RTCAudioTrackSink.h",
+           "objc/api/peerconnection/RTCConfiguration.h",
+           "objc/api/peerconnection/RTCDataChannel.h",
+           "objc/api/peerconnection/RTCDataChannelConfiguration.h",
+diff --git a/sdk/objc/api/RTCAudioTrackSinkAdapter+Private.h b/sdk/objc/api/RTCAudioTrackSinkAdapter+Private.h
+new file mode 100644
+index 0000000000..13d7f49679
+--- /dev/null
++++ b/sdk/objc/api/RTCAudioTrackSinkAdapter+Private.h
+@@ -0,0 +1,23 @@
++#import <Foundation/Foundation.h>
++#import "peerconnection/RTCAudioTrackSink.h"
++
++#include "api/media_stream_interface.h"
++
++NS_ASSUME_NONNULL_BEGIN
++
++@interface RTCAudioTrackSinkAdapter : NSObject
++
++- (instancetype)init NS_UNAVAILABLE;
++
++@property(nonatomic, readonly) id<RTC_OBJC_TYPE(RTCAudioTrackSink)>
++    audioTrackSink;
++
++@property(nonatomic, readonly) webrtc::AudioTrackSinkInterface* nativeAudioSink;
++
++- (instancetype)initWithAudioTrackSink:
++    (id<RTC_OBJC_TYPE(RTCAudioTrackSink)>)audioTrackSink
++    NS_DESIGNATED_INITIALIZER;
++
++@end
++
++NS_ASSUME_NONNULL_END
+diff --git a/sdk/objc/api/RTCAudioTrackSinkAdapter.mm b/sdk/objc/api/RTCAudioTrackSinkAdapter.mm
+new file mode 100644
+index 0000000000..2c22ffe71b
+--- /dev/null
++++ b/sdk/objc/api/RTCAudioTrackSinkAdapter.mm
+@@ -0,0 +1,76 @@
++#import "RTCAudioTrackSinkAdapter+Private.h"
++
++#include <memory>
++
++namespace webrtc {
++
++class AudioTrackSinkAdapter : public AudioTrackSinkInterface {
++ public:
++  explicit AudioTrackSinkAdapter(RTCAudioTrackSinkAdapter* adapter)
++      : adapter_(adapter) {}
++
++  void OnData(const void* audio_data,
++              int bits_per_sample,
++              int sample_rate,
++              size_t number_of_channels,
++              size_t number_of_frames) override {
++    @autoreleasepool {
++      id<RTC_OBJC_TYPE(RTCAudioTrackSink)> sink = adapter_.audioTrackSink;
++      if (!sink) {
++        return;
++      }
++      const size_t bytes_per_sample = bits_per_sample / 8;
++      const size_t data_size =
++          number_of_channels * number_of_frames * bytes_per_sample;
++
++      // WebRTC 側が所有するバッファはこのコールバック中しか有効でないため、
++      // 安全に使うため毎回 NSData にコピーして渡す。
++      NSData* audioData = [NSData dataWithBytes:audio_data length:data_size];
++
++      [sink onData:audioData
++             bitsPerSample:bits_per_sample
++                sampleRate:sample_rate
++          numberOfChannels:number_of_channels
++            numberOfFrames:number_of_frames];
++    }
++  }
++
++  int NumPreferredChannels() const override {
++    id<RTC_OBJC_TYPE(RTCAudioTrackSink)> sink = adapter_.audioTrackSink;
++    if (!sink) {
++      return -1;
++    }
++    if ([sink respondsToSelector:@selector(preferredNumberOfChannels)]) {
++      return static_cast<int>([sink preferredNumberOfChannels]);
++    }
++    return -1;
++  }
++
++ private:
++  __weak RTCAudioTrackSinkAdapter* adapter_;
++};
++
++}  // namespace webrtc
++
++@implementation RTCAudioTrackSinkAdapter {
++  std::unique_ptr<webrtc::AudioTrackSinkAdapter> _adapter;
++}
++
++@synthesize audioTrackSink = _audioTrackSink;
++
++- (instancetype)initWithAudioTrackSink:
++    (id<RTC_OBJC_TYPE(RTCAudioTrackSink)>)audioTrackSink {
++  NSParameterAssert(audioTrackSink);
++  self = [super init];
++  if (self) {
++    _audioTrackSink = audioTrackSink;
++    _adapter.reset(new webrtc::AudioTrackSinkAdapter(self));
++  }
++  return self;
++}
++
++- (webrtc::AudioTrackSinkInterface*)nativeAudioSink {
++  return _adapter.get();
++}
++
++@end
+diff --git a/sdk/objc/api/peerconnection/RTCAudioTrack.h b/sdk/objc/api/peerconnection/RTCAudioTrack.h
+index db8afb50fc..bc0a296156 100644
+--- a/sdk/objc/api/peerconnection/RTCAudioTrack.h
++++ b/sdk/objc/api/peerconnection/RTCAudioTrack.h
+@@ -14,6 +14,8 @@
+ NS_ASSUME_NONNULL_BEGIN
+
+ @class RTC_OBJC_TYPE(RTCAudioSource);
++@protocol RTC_OBJC_TYPE
++(RTCAudioTrackSink);
+
+ RTC_OBJC_EXPORT
+ @interface RTC_OBJC_TYPE (RTCAudioTrack) : RTC_OBJC_TYPE(RTCMediaStreamTrack)
+@@ -23,6 +25,12 @@ RTC_OBJC_EXPORT
+ /** The audio source for this audio track. */
+ @property(nonatomic, readonly) RTC_OBJC_TYPE(RTCAudioSource) * source;
+
++/** このトラックの音声データを受け取るシンクを登録します。 */
++- (void)addSink:(id<RTC_OBJC_TYPE(RTCAudioTrackSink)>)sink;
++
++/** シンクの登録を解除します。 */
++- (void)removeSink:(id<RTC_OBJC_TYPE(RTCAudioTrackSink)>)sink;
++
+ @end
+
+ NS_ASSUME_NONNULL_END
+diff --git a/sdk/objc/api/peerconnection/RTCAudioTrack.mm b/sdk/objc/api/peerconnection/RTCAudioTrack.mm
+index 5ba53c84e9..a0830cc789 100644
+--- a/sdk/objc/api/peerconnection/RTCAudioTrack.mm
++++ b/sdk/objc/api/peerconnection/RTCAudioTrack.mm
+@@ -13,11 +13,14 @@
+ #import "RTCAudioSource+Private.h"
+ #import "RTCMediaStreamTrack+Private.h"
+ #import "RTCPeerConnectionFactory+Private.h"
++#import "api/RTCAudioTrackSinkAdapter+Private.h"
+ #import "helpers/NSString+StdString.h"
+
+ #include "rtc_base/checks.h"
+
+-@implementation RTC_OBJC_TYPE (RTCAudioTrack)
++@implementation RTC_OBJC_TYPE (RTCAudioTrack) {
++  NSMutableArray *_adapters;
++}
+
+ @synthesize source = _source;
+
+@@ -66,6 +69,55 @@
+   return _source;
+ }
+
++- (void)dealloc {
++  for (RTCAudioTrackSinkAdapter *adapter in _adapters) {
++    self.nativeAudioTrack->RemoveSink(adapter.nativeAudioSink);
++  }
++}
++
++- (void)addSink:(id<RTC_OBJC_TYPE(RTCAudioTrackSink)>)sink {
++  if (!_adapters) {
++    _adapters = [NSMutableArray array];
++  }
++
++  for (RTCAudioTrackSinkAdapter *adapter in _adapters) {
++    if (adapter.audioTrackSink == sink) {
++      RTC_LOG(LS_INFO) << "|sink| is already attached to this track";
++      return;
++    }
++  }
++
++  RTCAudioTrackSinkAdapter *adapter =
++      [[RTCAudioTrackSinkAdapter alloc] initWithAudioTrackSink:sink];
++  [_adapters addObject:adapter];
++  self.nativeAudioTrack->AddSink(adapter.nativeAudioSink);
++}
++
++- (void)removeSink:(id<RTC_OBJC_TYPE(RTCAudioTrackSink)>)sink {
++  if (!_adapters) {
++    return;
++  }
++
++  __block NSUInteger indexToRemove = NSNotFound;
++  [_adapters
++      enumerateObjectsUsingBlock:^(
++          RTCAudioTrackSinkAdapter *adapter, NSUInteger idx, BOOL *stop) {
++        if (adapter.audioTrackSink == sink) {
++          indexToRemove = idx;
++          *stop = YES;
++        }
++      }];
++  if (indexToRemove == NSNotFound) {
++    RTC_LOG(LS_INFO)
++        << "removeSink called with a sink that has not been previously added";
++    return;
++  }
++  RTCAudioTrackSinkAdapter *adapterToRemove =
++      [_adapters objectAtIndex:indexToRemove];
++  self.nativeAudioTrack->RemoveSink(adapterToRemove.nativeAudioSink);
++  [_adapters removeObjectAtIndex:indexToRemove];
++}
++
+ #pragma mark - Private
+
+ - (webrtc::scoped_refptr<webrtc::AudioTrackInterface>)nativeAudioTrack {
+diff --git a/sdk/objc/api/peerconnection/RTCAudioTrackSink.h b/sdk/objc/api/peerconnection/RTCAudioTrackSink.h
+new file mode 100644
+index 0000000000..51e754e600
+--- /dev/null
++++ b/sdk/objc/api/peerconnection/RTCAudioTrackSink.h
+@@ -0,0 +1,38 @@
++#import <Foundation/Foundation.h>
++
++#import "sdk/objc/base/RTCMacros.h"
++
++NS_ASSUME_NONNULL_BEGIN
++
++RTC_OBJC_EXPORT
++@protocol RTC_OBJC_TYPE
++(RTCAudioTrackSink)<NSObject>
++    /**
++     * 音声データ受信コールバック
++     *
++     * @param audioData PCM 形式の音声データ。
++     * @param bitsPerSample 1 サンプルあたりのビット数。
++     *                      libwebrtc では PCM 形式の音声データは 16 bit
++     * 固定のため、常に 16 が渡されます。
++     * @param sampleRate サンプルレート (単位: Hz)
++     * @param numberOfChannels 音声データのチャンネル数。
++     *                         モノラルなら 1、ステレオなら 2 が渡されます。
++     * @param numberOfFrames audioData に含まれるフレーム数。
++     */
++    - (void)onData : (NSData *)audioData bitsPerSample
++    : (NSInteger)bitsPerSample sampleRate
++    : (NSInteger)sampleRate numberOfChannels
++    : (NSInteger)numberOfChannels numberOfFrames : (NSInteger)numberOfFrames;
++
++@optional
++/**
++ * onData で受け取る音声データのチャンネル数を指定するためのメソッドです。
++ * `-1` を指定した場合は音声データ規定のチャンネル数になります。
++ *
++ * @return チャンネル数（-1の場合は指定なし）
++ */
++- (NSInteger)preferredNumberOfChannels;
++
++@end
++
++NS_ASSUME_NONNULL_END
diff --git a/run.py b/run.py
@@ -259,6 +259,7 @@ def get_depot_tools(source_dir, fetch=False):
         "remove_crel.patch",
         "revert_siso.patch",
         "ios_revive_copy_framework_header.patch",
+        "ios_audio_track_sink.patch",
     ],
     "android": [
         "add_deps.patch",