python-gitlab · ericfrederich · Sep 17, 2024 · Oct 15, 2024 · nejch · Oct 18, 2024
diff --git a/gitlab/client.py b/gitlab/client.py
@@ -1167,13 +1167,17 @@ def __init__(
         url: str,
         query_data: Dict[str, Any],
         get_next: bool = True,
+        dedupe: bool = True,
-        dedupe: bool = True,
+        deduplicate: bool = True,
-        dedupe: bool = True,
+        deduplicate: bool = True,
         **kwargs: Any,
     ) -> None:
         self._gl = gl
 
         # Preserve kwargs for subsequent queries
         self._kwargs = kwargs.copy()
 
+        self._dedupe = dedupe
-        self._dedupe = dedupe
+        self._dedupe = deduplicate
-        self._dedupe = dedupe
+        self._dedupe = deduplicate
+        self._retrieved_object_ids: set[int] = set()
-        self._retrieved_object_ids: set[int] = set()
+        self._retrieved_ids: set[int] = set()
-        self._retrieved_object_ids: set[int] = set()
+        self._retrieved_ids: set[int] = set()
+
         self._query(url, query_data, **self._kwargs)
         self._get_next = get_next
 
@@ -1205,6 +1209,21 @@ def _query(
                 error_message="Failed to parse the server message"
             ) from e
 
+        if self._dedupe:
+            duplicate_ids = (
+                set(o["id"] for o in self._data) & self._retrieved_object_ids
 if isinstance(obj, list): 
     return [self._obj_cls(self, item, created_from_list=True) for item in obj] 
 return base.RESTObjectList(self, self._obj_cls, obj) 
 if isinstance(obj, list): 
     return [self._obj_cls(self, item, created_from_list=True) for item in obj] 
 return base.RESTObjectList(self, self._obj_cls, obj) 
+            )
+            if duplicate_ids:
-            duplicate_ids = (
-                set(o["id"] for o in self._data) & self._retrieved_object_ids
-            )
-            if duplicate_ids:
+            if duplicate_ids := {o["id"] for o in self._data) & self._retrieved_ids}:
-            duplicate_ids = (
-                set(o["id"] for o in self._data) & self._retrieved_object_ids
-            )
-            if duplicate_ids:
+            if duplicate_ids := {o["id"] for o in self._data) & self._retrieved_ids}:
+                utils.warn(
+                    message=(
+                        f"During pagination duplicate object(s) with id(s) "
+                        f"{duplicate_ids} returned from Gitlab and filtered"
+                    ),
+                    category=UserWarning,
+                )
+            self._data = [o for o in self._data if o["id"] not in duplicate_ids]
+            self._retrieved_object_ids.update(o["id"] for o in self._data)
+
         self._current = 0
 
     @property