quick nit

rate limit github fix
k
2026-02-19 00:35:46 +00:00 · 2025-02-19 11:28:13 -08:00 · 2025-02-19 11:28:13 -08:00 · 2025-02-19 11:28:13 -08:00 · 2025-02-19 11:28:13 -08:00 · 2025-02-19 11:28:13 -08:00
48 changed files with 324 additions and 785 deletions
--- a/.github/workflows/pr-integration-tests.yml
+++ b/.github/workflows/pr-integration-tests.yml
@@ -145,7 +145,7 @@ jobs:
        run: |
          cd deployment/docker_compose
          docker compose -f docker-compose.multitenant-dev.yml -p onyx-stack down -v
-
+      
      # NOTE: Use pre-ping/null pool to reduce flakiness due to dropped connections
      - name: Start Docker containers
        run: |
@@ -157,7 +157,6 @@ jobs:
          REQUIRE_EMAIL_VERIFICATION=false \
          DISABLE_TELEMETRY=true \
          IMAGE_TAG=test \
-          INTEGRATION_TESTS_MODE=true \
          docker compose -f docker-compose.dev.yml -p onyx-stack up -d
        id: start_docker

@@ -200,7 +199,7 @@ jobs:
          cd backend/tests/integration/mock_services
          docker compose -f docker-compose.mock-it-services.yml \
            -p mock-it-services-stack up -d
-
+      
      # NOTE: Use pre-ping/null to reduce flakiness due to dropped connections
      - name: Run Standard Integration Tests
        run: |
--- a/.github/workflows/pr-python-model-tests.yml
+++ b/.github/workflows/pr-python-model-tests.yml
@@ -1,16 +1,10 @@
-name: Model Server Tests
+name: Connector Tests

 on:
  schedule:
    # This cron expression runs the job daily at 16:00 UTC (9am PT)
    - cron: "0 16 * * *"
-  workflow_dispatch:
-    inputs:
-      branch:
-        description: 'Branch to run the workflow on'
-        required: false
-        default: 'main'
-        
+
 env:
  # Bedrock
  AWS_ACCESS_KEY_ID: ${{ secrets.AWS_ACCESS_KEY_ID }}
@@ -32,23 +26,6 @@ jobs:
      - name: Checkout code
        uses: actions/checkout@v4

-      - name: Login to Docker Hub
-        uses: docker/login-action@v3
-        with:
-          username: ${{ secrets.DOCKER_USERNAME }}
-          password: ${{ secrets.DOCKER_TOKEN }}
-
-      # tag every docker image with "test" so that we can spin up the correct set
-      # of images during testing
-
-      # We don't need to build the Web Docker image since it's not yet used
-      # in the integration tests. We have a separate action to verify that it builds
-      # successfully.
-      - name: Pull Model Server Docker image
-        run: |
-          docker pull onyxdotapp/onyx-model-server:latest
-          docker tag onyxdotapp/onyx-model-server:latest onyxdotapp/onyx-model-server:test
-          
      - name: Set up Python
        uses: actions/setup-python@v5
        with:
@@ -64,49 +41,6 @@ jobs:
          pip install --retries 5 --timeout 30 -r backend/requirements/default.txt
          pip install --retries 5 --timeout 30 -r backend/requirements/dev.txt

-      - name: Start Docker containers
-        run: |
-          cd deployment/docker_compose
-          ENABLE_PAID_ENTERPRISE_EDITION_FEATURES=true \
-          AUTH_TYPE=basic \
-          REQUIRE_EMAIL_VERIFICATION=false \
-          DISABLE_TELEMETRY=true \
-          IMAGE_TAG=test \
-          docker compose -f docker-compose.dev.yml -p onyx-stack up -d indexing_model_server
-        id: start_docker
-
-      - name: Wait for service to be ready
-        run: |
-          echo "Starting wait-for-service script..."
-
-          start_time=$(date +%s)
-          timeout=300  # 5 minutes in seconds
-
-          while true; do
-            current_time=$(date +%s)
-            elapsed_time=$((current_time - start_time))
-            
-            if [ $elapsed_time -ge $timeout ]; then
-              echo "Timeout reached. Service did not become ready in 5 minutes."
-              exit 1
-            fi
-            
-            # Use curl with error handling to ignore specific exit code 56
-            response=$(curl -s -o /dev/null -w "%{http_code}" http://localhost:9000/api/health || echo "curl_error")
-            
-            if [ "$response" = "200" ]; then
-              echo "Service is ready!"
-              break
-            elif [ "$response" = "curl_error" ]; then
-              echo "Curl encountered an error, possibly exit code 56. Continuing to retry..."
-            else
-              echo "Service not ready yet (HTTP status $response). Retrying in 5 seconds..."
-            fi
-            
-            sleep 5
-          done
-          echo "Finished waiting for service."
-          
      - name: Run Tests
        shell: script -q -e -c "bash --noprofile --norc -eo pipefail {0}"
        run: |
@@ -122,10 +56,3 @@ jobs:
            -H 'Content-type: application/json' \
            --data '{"text":"Scheduled Model Tests failed! Check the run at: https://github.com/${{ github.repository }}/actions/runs/${{ github.run_id }}"}' \
            $SLACK_WEBHOOK
-            
-      - name: Stop Docker containers
-        if: always()
-        run: |
-          cd deployment/docker_compose
-          docker compose -f docker-compose.dev.yml -p onyx-stack down -v
-          
--- a/README.md
+++ b/README.md
@@ -26,12 +26,12 @@

 <strong>[Onyx](https://www.onyx.app/)</strong> (formerly Danswer) is the AI platform connected to your company's docs, apps, and people.
 Onyx provides a feature rich Chat interface and plugs into any LLM of your choice.
-Keep knowledge and access controls sync-ed across over 40 connectors like Google Drive, Slack, Confluence, Salesforce, etc.
-Create custom AI agents with unique prompts, knowledge, and actions that the agents can take.
+There are over 40 supported connectors such as Google Drive, Slack, Confluence, Salesforce, etc. which keep knowledge and permissions up to date.
+Create custom AI agents with unique prompts, knowledge, and actions the agents can take.
 Onyx can be deployed securely anywhere and for any scale - on a laptop, on-premise, or to cloud.


-<h3>Feature Highlights</h3>
+<h3>Feature Showcase</h3>

 **Deep research over your team's knowledge:**

@@ -63,21 +63,22 @@ We also have built-in support for high-availability/scalable deployment on Kuber
 References [here](https://github.com/onyx-dot-app/onyx/tree/main/deployment).


-## 🔍 Other Notable Benefits of Onyx
- Custom deep learning models for indexing and inference time, only through Onyx + learning from user feedback.
- Flexible security features like SSO (OIDC/SAML/OAuth2), RBAC, encryption of credentials, etc.
- Knowledge curation features like document-sets, query history, usage analytics, etc.
- Scalable deployment options tested up to many tens of thousands users and hundreds of millions of documents.
-
-
 ## 🚧 Roadmap
- New methods in information retrieval (StructRAG, LightGraphRAG, etc.)
+- Extensions to the Chrome Plugin
+- Latest methods in information retrieval (StructRAG, LightGraphRAG, etc.)
 - Personalized Search
 - Organizational understanding and ability to locate and suggest experts from your team.
 - Code Search
 - SQL and Structured Query Language


+## 🔍 Other Notable Benefits of Onyx
+- Custom deep learning models only through Onyx + learn from user feedback.
+- Flexible security features like SSO (OIDC/SAML/OAuth2), RBAC, encryption of credentials, etc.
+- Knowledge curation features like document-sets, query history, usage analytics, etc.
+- Scalable deployment options tested up to many tens of thousands users and hundreds of millions of documents.
+
+
 ## 🔌 Connectors
 Keep knowledge and access up to sync across 40+ connectors:

--- a/backend/alembic/versions/f13db29f3101_add_composite_index_for_last_modified_.py
+++ b/backend/alembic/versions/f13db29f3101_add_composite_index_for_last_modified_.py
@@ -1,27 +0,0 @@
-"""Add composite index for last_modified and last_synced to document
-
-Revision ID: f13db29f3101
-Revises: b388730a2899
-Create Date: 2025-02-18 22:48:11.511389
-
-"""
-from alembic import op
-
-# revision identifiers, used by Alembic.
-revision = "f13db29f3101"
-down_revision = "acaab4ef4507"
-branch_labels: str | None = None
-depends_on: str | None = None
-
-
-def upgrade() -> None:
-    op.create_index(
-        "ix_document_sync_status",
-        "document",
-        ["last_modified", "last_synced"],
-        unique=False,
-    )
-
-
-def downgrade() -> None:
-    op.drop_index("ix_document_sync_status", table_name="document")
--- a/backend/model_server/encoders.py
+++ b/backend/model_server/encoders.py
@@ -98,17 +98,12 @@ class CloudEmbedding:
            return final_embeddings
        except Exception as e:
            error_string = (
-                f"Exception embedding text with OpenAI - {type(e)}: "
-                f"Model: {model} "
-                f"Provider: {self.provider} "
-                f"Exception: {e}"
+                f"Error embedding text with OpenAI: {str(e)} \n"
+                f"Model: {model} \n"
+                f"Provider: {self.provider} \n"
+                f"Texts: {texts}"
            )
            logger.error(error_string)
-
-            # only log text when it's not an authentication error.
-            if not isinstance(e, openai.AuthenticationError):
-                logger.debug(f"Exception texts: {texts}")
-
            raise RuntimeError(error_string)

    async def _embed_cohere(
--- a/backend/onyx/auth/email_utils.py
+++ b/backend/onyx/auth/email_utils.py
@@ -10,7 +10,6 @@ from onyx.configs.app_configs import SMTP_PORT
 from onyx.configs.app_configs import SMTP_SERVER
 from onyx.configs.app_configs import SMTP_USER
 from onyx.configs.app_configs import WEB_DOMAIN
-from onyx.configs.constants import AuthType
 from onyx.configs.constants import TENANT_ID_COOKIE_NAME
 from onyx.db.models import User

@@ -188,51 +187,23 @@ def send_subscription_cancellation_email(user_email: str) -> None:
    send_email(user_email, subject, html_content, text_content)


-def send_user_email_invite(
-    user_email: str, current_user: User, auth_type: AuthType
-) -> None:
+def send_user_email_invite(user_email: str, current_user: User) -> None:
    subject = "Invitation to Join Onyx Organization"
    heading = "You've Been Invited!"
-
-    # the exact action taken by the user, and thus the message, depends on the auth type
-    message = f"<p>You have been invited by {current_user.email} to join an organization on Onyx.</p>"
-    if auth_type == AuthType.CLOUD:
-        message += (
-            "<p>To join the organization, please click the button below to set a password "
-            "or login with Google and complete your registration.</p>"
-        )
-    elif auth_type == AuthType.BASIC:
-        message += (
-            "<p>To join the organization, please click the button below to set a password "
-            "and complete your registration.</p>"
-        )
-    elif auth_type == AuthType.GOOGLE_OAUTH:
-        message += (
-            "<p>To join the organization, please click the button below to login with Google "
-            "and complete your registration.</p>"
-        )
-    elif auth_type == AuthType.OIDC or auth_type == AuthType.SAML:
-        message += (
-            "<p>To join the organization, please click the button below to"
-            " complete your registration.</p>"
-        )
-    else:
-        raise ValueError(f"Invalid auth type: {auth_type}")
-
+    message = (
+        f"<p>You have been invited by {current_user.email} to join an organization on Onyx.</p>"
+        "<p>To join the organization, please click the button below to set a password "
+        "or login with Google and complete your registration.</p>"
+    )
    cta_text = "Join Organization"
    cta_link = f"{WEB_DOMAIN}/auth/signup?email={user_email}"
    html_content = build_html_email(heading, message, cta_text, cta_link)
-
-    # text content is the fallback for clients that don't support HTML
-    # not as critical, so not having special cases for each auth type
    text_content = (
        f"You have been invited by {current_user.email} to join an organization on Onyx.\n"
        "To join the organization, please visit the following link:\n"
        f"{WEB_DOMAIN}/auth/signup?email={user_email}\n"
+        "You'll be asked to set a password or login with Google to complete your registration."
    )
-    if auth_type == AuthType.CLOUD:
-        text_content += "You'll be asked to set a password or login with Google to complete your registration."
-
    send_email(user_email, subject, html_content, text_content)


--- a/backend/onyx/background/celery/apps/app_base.py
+++ b/backend/onyx/background/celery/apps/app_base.py
@@ -140,7 +140,7 @@ def on_task_postrun(
        f"{f'for tenant_id={tenant_id}' if tenant_id else ''}"
    )

-    r = get_redis_client(tenant_id=tenant_id)
+    r = get_redis_client()

    if task_id.startswith(RedisConnectorCredentialPair.PREFIX):
        r.srem(RedisConnectorCredentialPair.get_taskset_key(), task_id)
--- a/backend/onyx/background/celery/tasks/external_group_syncing/tasks.py
+++ b/backend/onyx/background/celery/tasks/external_group_syncing/tasks.py
@@ -361,7 +361,6 @@ def connector_external_group_sync_generator_task(
            cc_pair = get_connector_credential_pair_from_id(
                db_session=db_session,
                cc_pair_id=cc_pair_id,
-                eager_load_credential=True,
            )
            if cc_pair is None:
                raise ValueError(
--- a/backend/onyx/background/indexing/run_indexing.py
+++ b/backend/onyx/background/indexing/run_indexing.py
@@ -15,7 +15,6 @@ from onyx.background.indexing.memory_tracer import MemoryTracer
 from onyx.configs.app_configs import INDEX_BATCH_SIZE
 from onyx.configs.app_configs import INDEXING_SIZE_WARNING_THRESHOLD
 from onyx.configs.app_configs import INDEXING_TRACER_INTERVAL
-from onyx.configs.app_configs import INTEGRATION_TESTS_MODE
 from onyx.configs.app_configs import LEAVE_CONNECTOR_ACTIVE_ON_INITIALIZATION_FAILURE
 from onyx.configs.app_configs import POLL_CONNECTOR_OFFSET
 from onyx.configs.constants import DocumentSource
@@ -90,8 +89,8 @@ def _get_connector_runner(
        )

        # validate the connector settings
-        if not INTEGRATION_TESTS_MODE:
-            runnable_connector.validate_connector_settings()
+
+        runnable_connector.validate_connector_settings()

    except Exception as e:
        logger.exception(f"Unable to instantiate connector due to {e}")
--- a/backend/onyx/chat/chat_utils.py
+++ b/backend/onyx/chat/chat_utils.py
@@ -190,8 +190,7 @@ def create_chat_chain(
            and previous_message.message_type == MessageType.ASSISTANT
            and mainline_messages
        ):
-            if current_message.refined_answer_improvement:
-                mainline_messages[-1] = current_message
+            mainline_messages[-1] = current_message
        else:
            mainline_messages.append(current_message)

--- a/backend/onyx/chat/models.py
+++ b/backend/onyx/chat/models.py
@@ -142,15 +142,6 @@ class MessageResponseIDInfo(BaseModel):
    reserved_assistant_message_id: int


-class AgentMessageIDInfo(BaseModel):
-    level: int
-    message_id: int
-
-
-class AgenticMessageResponseIDInfo(BaseModel):
-    agentic_message_ids: list[AgentMessageIDInfo]
-
-
 class StreamingError(BaseModel):
    error: str
    stack_trace: str | None = None
--- a/backend/onyx/chat/process_message.py
+++ b/backend/onyx/chat/process_message.py
@@ -11,8 +11,6 @@ from onyx.agents.agent_search.orchestration.nodes.call_tool import ToolCallExcep
 from onyx.chat.answer import Answer
 from onyx.chat.chat_utils import create_chat_chain
 from onyx.chat.chat_utils import create_temporary_persona
-from onyx.chat.models import AgenticMessageResponseIDInfo
-from onyx.chat.models import AgentMessageIDInfo
 from onyx.chat.models import AgentSearchPacket
 from onyx.chat.models import AllCitations
 from onyx.chat.models import AnswerPostInfo
@@ -310,7 +308,6 @@ ChatPacket = (
    | CustomToolResponse
    | MessageSpecificCitations
    | MessageResponseIDInfo
-    | AgenticMessageResponseIDInfo
    | StreamStopInfo
    | AgentSearchPacket
 )
@@ -1038,7 +1035,6 @@ def stream_chat_message_objects(
        next_level = 1
        prev_message = gen_ai_response_message
        agent_answers = answer.llm_answer_by_level()
-        agentic_message_ids = []
        while next_level in agent_answers:
            next_answer = agent_answers[next_level]
            info = info_by_subq[
@@ -1063,18 +1059,17 @@ def stream_chat_message_objects(
                refined_answer_improvement=refined_answer_improvement,
                is_agentic=True,
            )
-            agentic_message_ids.append(
-                AgentMessageIDInfo(level=next_level, message_id=next_answer_message.id)
-            )
            next_level += 1
            prev_message = next_answer_message

        logger.debug("Committing messages")
        db_session.commit()  # actually save user / assistant message

-        yield AgenticMessageResponseIDInfo(agentic_message_ids=agentic_message_ids)
+        msg_detail_response = translate_db_message_to_chat_message_detail(
+            gen_ai_response_message
+        )

-        yield translate_db_message_to_chat_message_detail(gen_ai_response_message)
+        yield msg_detail_response
    except Exception as e:
        error_msg = str(e)
        logger.exception(error_msg)
--- a/backend/onyx/configs/app_configs.py
+++ b/backend/onyx/configs/app_configs.py
@@ -158,7 +158,7 @@ POSTGRES_USER = os.environ.get("POSTGRES_USER") or "postgres"
 POSTGRES_PASSWORD = urllib.parse.quote_plus(
    os.environ.get("POSTGRES_PASSWORD") or "password"
 )
-POSTGRES_HOST = os.environ.get("POSTGRES_HOST") or "127.0.0.1"
+POSTGRES_HOST = os.environ.get("POSTGRES_HOST") or "localhost"
 POSTGRES_PORT = os.environ.get("POSTGRES_PORT") or "5432"
 POSTGRES_DB = os.environ.get("POSTGRES_DB") or "postgres"
 AWS_REGION_NAME = os.environ.get("AWS_REGION_NAME") or "us-east-2"
@@ -626,8 +626,6 @@ POD_NAMESPACE = os.environ.get("POD_NAMESPACE")

 DEV_MODE = os.environ.get("DEV_MODE", "").lower() == "true"

-INTEGRATION_TESTS_MODE = os.environ.get("INTEGRATION_TESTS_MODE", "").lower() == "true"
-
 MOCK_CONNECTOR_FILE_PATH = os.environ.get("MOCK_CONNECTOR_FILE_PATH")

 TEST_ENV = os.environ.get("TEST_ENV", "").lower() == "true"
--- a/backend/onyx/connectors/factory.py
+++ b/backend/onyx/connectors/factory.py
@@ -3,7 +3,6 @@ from typing import Type

 from sqlalchemy.orm import Session

-from onyx.configs.app_configs import INTEGRATION_TESTS_MODE
 from onyx.configs.constants import DocumentSource
 from onyx.configs.constants import DocumentSourceRequiringTenantContext
 from onyx.connectors.airtable.airtable_connector import AirtableConnector
@@ -188,9 +187,6 @@ def validate_ccpair_for_user(
    user: User | None,
    tenant_id: str | None,
 ) -> None:
-    if INTEGRATION_TESTS_MODE:
-        return
-
    # Validate the connector settings
    connector = fetch_connector_by_id(connector_id, db_session)
    credential = fetch_credential_by_id_for_user(
@@ -199,18 +195,10 @@ def validate_ccpair_for_user(
        db_session,
        get_editable=False,
    )
-
-    if not connector:
-        raise ValueError("Connector not found")
-
-    if (
-        connector.source == DocumentSource.INGESTION_API
-        or connector.source == DocumentSource.MOCK_CONNECTOR
-    ):
-        return
-
    if not credential:
        raise ValueError("Credential not found")
+    if not connector:
+        raise ValueError("Connector not found")

    try:
        runnable_connector = instantiate_connector(
--- a/backend/onyx/connectors/gitbook/connector.py
+++ b/backend/onyx/connectors/gitbook/connector.py
@@ -229,20 +229,16 @@ class GitbookConnector(LoadConnector, PollConnector):

        try:
            content = self.client.get(f"/spaces/{self.space_id}/content")
-            pages: list[dict[str, Any]] = content.get("pages", [])
+            pages = content.get("pages", [])
+
            current_batch: list[Document] = []
+            for page in pages:
+                updated_at = datetime.fromisoformat(page["updatedAt"])

-            while pages:
-                page = pages.pop(0)
-
-                updated_at_raw = page.get("updatedAt")
-                if updated_at_raw is None:
-                    # if updatedAt is not present, that means the page has never been edited
-                    continue
-
-                updated_at = datetime.fromisoformat(updated_at_raw)
                if start and updated_at < start:
-                    continue
+                    if current_batch:
+                        yield current_batch
+                    return
                if end and updated_at > end:
                    continue

@@ -254,8 +250,6 @@ class GitbookConnector(LoadConnector, PollConnector):
                    yield current_batch
                    current_batch = []

-                pages.extend(page.get("pages", []))
-
            if current_batch:
                yield current_batch

--- a/backend/onyx/connectors/google_drive/connector.py
+++ b/backend/onyx/connectors/google_drive/connector.py
@@ -220,14 +220,7 @@ class GoogleDriveConnector(LoadConnector, PollConnector, SlimConnector):
        return self._creds

    def load_credentials(self, credentials: dict[str, Any]) -> dict[str, str] | None:
-        try:
-            self._primary_admin_email = credentials[DB_CREDENTIALS_PRIMARY_ADMIN_KEY]
-        except KeyError:
-            raise ValueError(
-                "Primary admin email missing, "
-                "should not call this property "
-                "before calling load_credentials"
-            )
+        self._primary_admin_email = credentials[DB_CREDENTIALS_PRIMARY_ADMIN_KEY]

        self._creds, new_creds_dict = get_google_creds(
            credentials=credentials,
--- a/backend/onyx/db/connector_credential_pair.py
+++ b/backend/onyx/db/connector_credential_pair.py
@@ -194,14 +194,9 @@ def get_connector_credential_pair_from_id_for_user(
 def get_connector_credential_pair_from_id(
    db_session: Session,
    cc_pair_id: int,
-    eager_load_credential: bool = False,
 ) -> ConnectorCredentialPair | None:
    stmt = select(ConnectorCredentialPair).distinct()
    stmt = stmt.where(ConnectorCredentialPair.id == cc_pair_id)
-
-    if eager_load_credential:
-        stmt = stmt.options(joinedload(ConnectorCredentialPair.credential))
-
    result = db_session.execute(stmt)
    return result.scalar_one_or_none()

--- a/backend/onyx/db/document.py
+++ b/backend/onyx/db/document.py
@@ -60,8 +60,9 @@ def count_documents_by_needs_sync(session: Session) -> int:
    This function executes the query and returns the count of
    documents matching the criteria."""

-    return (
-        session.query(DbDocument.id)
+    count = (
+        session.query(func.count(DbDocument.id.distinct()))
+        .select_from(DbDocument)
        .join(
            DocumentByConnectorCredentialPair,
            DbDocument.id == DocumentByConnectorCredentialPair.id,
@@ -72,53 +73,63 @@ def count_documents_by_needs_sync(session: Session) -> int:
                DbDocument.last_synced.is_(None),
            )
        )
-        .count()
+        .scalar()
    )

+    return count
+

 def construct_document_select_for_connector_credential_pair_by_needs_sync(
    connector_id: int, credential_id: int
 ) -> Select:
-    return (
-        select(DbDocument)
-        .join(
-            DocumentByConnectorCredentialPair,
-            DbDocument.id == DocumentByConnectorCredentialPair.id,
-        )
-        .where(
-            and_(
-                DocumentByConnectorCredentialPair.connector_id == connector_id,
-                DocumentByConnectorCredentialPair.credential_id == credential_id,
-                or_(
-                    DbDocument.last_modified > DbDocument.last_synced,
-                    DbDocument.last_synced.is_(None),
-                ),
-            )
+    initial_doc_ids_stmt = select(DocumentByConnectorCredentialPair.id).where(
+        and_(
+            DocumentByConnectorCredentialPair.connector_id == connector_id,
+            DocumentByConnectorCredentialPair.credential_id == credential_id,
        )
    )

+    stmt = (
+        select(DbDocument)
+        .where(
+            DbDocument.id.in_(initial_doc_ids_stmt),
+            or_(
+                DbDocument.last_modified
+                > DbDocument.last_synced,  # last_modified is newer than last_synced
+                DbDocument.last_synced.is_(None),  # never synced
+            ),
+        )
+        .distinct()
+    )
+
+    return stmt
+

 def construct_document_id_select_for_connector_credential_pair_by_needs_sync(
    connector_id: int, credential_id: int
 ) -> Select:
-    return (
-        select(DbDocument.id)
-        .join(
-            DocumentByConnectorCredentialPair,
-            DbDocument.id == DocumentByConnectorCredentialPair.id,
-        )
-        .where(
-            and_(
-                DocumentByConnectorCredentialPair.connector_id == connector_id,
-                DocumentByConnectorCredentialPair.credential_id == credential_id,
-                or_(
-                    DbDocument.last_modified > DbDocument.last_synced,
-                    DbDocument.last_synced.is_(None),
-                ),
-            )
+    initial_doc_ids_stmt = select(DocumentByConnectorCredentialPair.id).where(
+        and_(
+            DocumentByConnectorCredentialPair.connector_id == connector_id,
+            DocumentByConnectorCredentialPair.credential_id == credential_id,
        )
    )

+    stmt = (
+        select(DbDocument.id)
+        .where(
+            DbDocument.id.in_(initial_doc_ids_stmt),
+            or_(
+                DbDocument.last_modified
+                > DbDocument.last_synced,  # last_modified is newer than last_synced
+                DbDocument.last_synced.is_(None),  # never synced
+            ),
+        )
+        .distinct()
+    )
+
+    return stmt
+

 def get_all_documents_needing_vespa_sync_for_cc_pair(
    db_session: Session, cc_pair_id: int
--- a/backend/onyx/db/models.py
+++ b/backend/onyx/db/models.py
@@ -570,14 +570,6 @@ class Document(Base):
        back_populates="documents",
    )

-    __table_args__ = (
-        Index(
-            "ix_document_sync_status",
-            last_modified,
-            last_synced,
-        ),
-    )
-

 class Tag(Base):
    __tablename__ = "tag"
--- a/backend/onyx/llm/models.py
+++ b/backend/onyx/llm/models.py
@@ -23,7 +23,6 @@ class PreviousMessage(BaseModel):
    message_type: MessageType
    files: list[InMemoryChatFile]
    tool_call: ToolCallFinalResult | None
-    refined_answer_improvement: bool | None

    @classmethod
    def from_chat_message(
@@ -48,7 +47,6 @@ class PreviousMessage(BaseModel):
            )
            if chat_message.tool_call
            else None,
-            refined_answer_improvement=chat_message.refined_answer_improvement,
        )

    def to_langchain_msg(self) -> BaseMessage:
--- a/backend/onyx/server/manage/users.py
+++ b/backend/onyx/server/manage/users.py
@@ -311,23 +311,19 @@ def bulk_invite_users(
    all_emails = list(set(new_invited_emails) | set(initial_invited_users))
    number_of_invited_users = write_invited_users(all_emails)

-    # send out email invitations if enabled
-    if ENABLE_EMAIL_INVITES:
-        try:
-            for email in new_invited_emails:
-                send_user_email_invite(email, current_user, AUTH_TYPE)
-        except Exception as e:
-            logger.error(f"Error sending email invite to invited users: {e}")
-
    if not MULTI_TENANT:
        return number_of_invited_users
-
-    # for billing purposes, write to the control plane about the number of new users
    try:
        logger.info("Registering tenant users")
        fetch_ee_implementation_or_noop(
            "onyx.server.tenants.billing", "register_tenant_users", None
        )(tenant_id, get_total_users_count(db_session))
+        if ENABLE_EMAIL_INVITES:
+            try:
+                for email in new_invited_emails:
+                    send_user_email_invite(email, current_user)
+            except Exception as e:
+                logger.error(f"Error sending email invite to invited users: {e}")

        return number_of_invited_users
    except Exception as e:
--- a/backend/onyx/server/settings/models.py
+++ b/backend/onyx/server/settings/models.py
@@ -45,7 +45,7 @@ class Settings(BaseModel):
    gpu_enabled: bool | None = None
    application_status: ApplicationStatus = ApplicationStatus.ACTIVE
    anonymous_user_enabled: bool | None = None
-    pro_search_enabled: bool | None = None
+    pro_search_disabled: bool | None = None

    temperature_override_enabled: bool = False
    auto_scroll: bool = False
--- a/backend/requirements/ee.txt
+++ b/backend/requirements/ee.txt
@@ -1,4 +1,3 @@
 cohere==5.6.1
 posthog==3.7.4
 python3-saml==1.15.0
-xmlsec==1.3.14
--- a/backend/scripts/debugging/onyx_redis.py
+++ b/backend/scripts/debugging/onyx_redis.py
@@ -3,7 +3,6 @@ import json
 import logging
 import sys
 import time
-from enum import Enum
 from logging import getLogger
 from typing import cast
 from uuid import UUID
@@ -21,13 +20,10 @@ from onyx.configs.app_configs import REDIS_PORT
 from onyx.configs.app_configs import REDIS_SSL
 from onyx.db.engine import get_session_with_tenant
 from onyx.db.users import get_user_by_email
-from onyx.redis.redis_connector import RedisConnector
-from onyx.redis.redis_connector_index import RedisConnectorIndex
 from onyx.redis.redis_pool import RedisPool
 from shared_configs.configs import MULTI_TENANT
 from shared_configs.configs import POSTGRES_DEFAULT_SCHEMA
 from shared_configs.contextvars import CURRENT_TENANT_ID_CONTEXTVAR
-from shared_configs.contextvars import get_current_tenant_id

 # Tool to run helpful operations on Redis in production
 # This is targeted for internal usage and may not have all the necessary parameters
@@ -46,19 +42,6 @@ SCAN_ITER_COUNT = 10000
 BATCH_DEFAULT = 1000


-class OnyxRedisCommand(Enum):
-    purge_connectorsync_taskset = "purge_connectorsync_taskset"
-    purge_documentset_taskset = "purge_documentset_taskset"
-    purge_usergroup_taskset = "purge_usergroup_taskset"
-    purge_locks_blocking_deletion = "purge_locks_blocking_deletion"
-    purge_vespa_syncing = "purge_vespa_syncing"
-    get_user_token = "get_user_token"
-    delete_user_token = "delete_user_token"
-
-    def __str__(self) -> str:
-        return self.value
-
-
 def get_user_id(user_email: str) -> tuple[UUID, str]:
    tenant_id = (
        get_tenant_id_for_email(user_email) if MULTI_TENANT else POSTGRES_DEFAULT_SCHEMA
@@ -72,79 +55,50 @@ def get_user_id(user_email: str) -> tuple[UUID, str]:


 def onyx_redis(
-    command: OnyxRedisCommand,
+    command: str,
    batch: int,
    dry_run: bool,
-    ssl: bool,
    host: str,
    port: int,
    db: int,
    password: str | None,
    user_email: str | None = None,
-    cc_pair_id: int | None = None,
 ) -> int:
-    # this is global and not tenant aware
    pool = RedisPool.create_pool(
        host=host,
        port=port,
        db=db,
        password=password if password else "",
-        ssl=ssl,
+        ssl=REDIS_SSL,
        ssl_cert_reqs="optional",
        ssl_ca_certs=None,
    )

    r = Redis(connection_pool=pool)

-    logger.info("Redis ping starting. This may hang if your settings are incorrect.")
-
    try:
        r.ping()
    except:
        logger.exception("Redis ping exceptioned")
        raise

-    logger.info("Redis ping succeeded.")
-
-    if command == OnyxRedisCommand.purge_connectorsync_taskset:
+    if command == "purge_connectorsync_taskset":
        """Purge connector tasksets. Used when the tasks represented in the tasksets
        have been purged."""
        return purge_by_match_and_type(
            "*connectorsync_taskset*", "set", batch, dry_run, r
        )
-    elif command == OnyxRedisCommand.purge_documentset_taskset:
+    elif command == "purge_documentset_taskset":
        return purge_by_match_and_type(
            "*documentset_taskset*", "set", batch, dry_run, r
        )
-    elif command == OnyxRedisCommand.purge_usergroup_taskset:
+    elif command == "purge_usergroup_taskset":
        return purge_by_match_and_type("*usergroup_taskset*", "set", batch, dry_run, r)
-    elif command == OnyxRedisCommand.purge_locks_blocking_deletion:
-        if cc_pair_id is None:
-            logger.error("You must specify --cc-pair with purge_deletion_locks")
-            return 1
-
-        tenant_id = get_current_tenant_id()
-        logger.info(f"Purging locks associated with deleting cc_pair={cc_pair_id}.")
-        redis_connector = RedisConnector(tenant_id, cc_pair_id)
-
-        match_pattern = f"{tenant_id}:{RedisConnectorIndex.FENCE_PREFIX}_{cc_pair_id}/*"
-        purge_by_match_and_type(match_pattern, "string", batch, dry_run, r)
-
-        redis_delete_if_exists_helper(
-            f"{tenant_id}:{redis_connector.prune.fence_key}", dry_run, r
-        )
-        redis_delete_if_exists_helper(
-            f"{tenant_id}:{redis_connector.permissions.fence_key}", dry_run, r
-        )
-        redis_delete_if_exists_helper(
-            f"{tenant_id}:{redis_connector.external_group_sync.fence_key}", dry_run, r
-        )
-        return 0
-    elif command == OnyxRedisCommand.purge_vespa_syncing:
+    elif command == "purge_vespa_syncing":
        return purge_by_match_and_type(
            "*connectorsync:vespa_syncing*", "string", batch, dry_run, r
        )
-    elif command == OnyxRedisCommand.get_user_token:
+    elif command == "get_user_token":
        if not user_email:
            logger.error("You must specify --user-email with get_user_token")
            return 1
@@ -155,7 +109,7 @@ def onyx_redis(
        else:
            print(f"No token found for user {user_email}")
            return 2
-    elif command == OnyxRedisCommand.delete_user_token:
+    elif command == "delete_user_token":
        if not user_email:
            logger.error("You must specify --user-email with delete_user_token")
            return 1
@@ -177,25 +131,6 @@ def flush_batch_delete(batch_keys: list[bytes], r: Redis) -> None:
        pipe.execute()


-def redis_delete_if_exists_helper(key: str, dry_run: bool, r: Redis) -> bool:
-    """Returns True if the key was found, False if not.
-    This function exists for logging purposes as the delete operation itself
-    doesn't really need to check the existence of the key.
-    """
-
-    if not r.exists(key):
-        logger.info(f"Did not find {key}.")
-        return False
-
-    if dry_run:
-        logger.info(f"(DRY-RUN) Deleting {key}.")
-    else:
-        logger.info(f"Deleting {key}.")
-        r.delete(key)
-
-    return True
-
-
 def purge_by_match_and_type(
    match_pattern: str, match_type: str, batch_size: int, dry_run: bool, r: Redis
 ) -> int:
@@ -203,12 +138,6 @@ def purge_by_match_and_type(
    match_type: https://redis.io/docs/latest/commands/type/
    """

-    logger.info(
-        f"purge_by_match_and_type start: "
-        f"match_pattern={match_pattern} "
-        f"match_type={match_type}"
-    )
-
    # cursor = "0"
    # while cursor != 0:
    #     cursor, data = self.scan(
@@ -235,15 +164,13 @@ def purge_by_match_and_type(
        logger.info(f"Deleting item {count}: {key_str}")

        batch_keys.append(key)
-
-        # flush if batch size has been reached
        if len(batch_keys) >= batch_size:
            flush_batch_delete(batch_keys, r)
            batch_keys.clear()

-    # final flush
-    flush_batch_delete(batch_keys, r)
-    batch_keys.clear()
+    if len(batch_keys) >= batch_size:
+        flush_batch_delete(batch_keys, r)
+        batch_keys.clear()

    logger.info(f"Deleted {count} matches.")

@@ -352,21 +279,7 @@ def delete_user_token_from_redis(

 if __name__ == "__main__":
    parser = argparse.ArgumentParser(description="Onyx Redis Manager")
-    parser.add_argument(
-        "--command",
-        type=OnyxRedisCommand,
-        help="The command to run",
-        choices=list(OnyxRedisCommand),
-        required=True,
-    )
-
-    parser.add_argument(
-        "--ssl",
-        type=bool,
-        default=REDIS_SSL,
-        help="Use SSL when connecting to Redis. Usually True for prod and False for local testing",
-        required=False,
-    )
+    parser.add_argument("--command", type=str, help="Operation to run", required=True)

    parser.add_argument(
        "--host",
@@ -429,13 +342,6 @@ if __name__ == "__main__":
        required=False,
    )

-    parser.add_argument(
-        "--cc-pair",
-        type=int,
-        help="A connector credential pair id. Used with the purge_deletion_locks command.",
-        required=False,
-    )
-
    args = parser.parse_args()

    if args.tenant_id:
@@ -462,12 +368,10 @@ if __name__ == "__main__":
        command=args.command,
        batch=args.batch,
        dry_run=args.dry_run,
-        ssl=args.ssl,
        host=args.host,
        port=args.port,
        db=args.db,
        password=args.password,
        user_email=args.user_email,
-        cc_pair_id=args.cc_pair,
    )
    sys.exit(exitcode)
--- a/backend/tests/integration/common_utils/constants.py
+++ b/backend/tests/integration/common_utils/constants.py
@@ -3,7 +3,7 @@ import os
 ADMIN_USER_NAME = "admin_user"

 API_SERVER_PROTOCOL = os.getenv("API_SERVER_PROTOCOL") or "http"
-API_SERVER_HOST = os.getenv("API_SERVER_HOST") or "127.0.0.1"
+API_SERVER_HOST = os.getenv("API_SERVER_HOST") or "localhost"
 API_SERVER_PORT = os.getenv("API_SERVER_PORT") or "8080"
 API_SERVER_URL = f"{API_SERVER_PROTOCOL}://{API_SERVER_HOST}:{API_SERVER_PORT}"
 MAX_DELAY = 45
--- a/backend/tests/integration/common_utils/managers/connector.py
+++ b/backend/tests/integration/common_utils/managers/connector.py
@@ -30,10 +30,8 @@ class ConnectorManager:
            name=name,
            source=source,
            input_type=input_type,
-            connector_specific_config=(
-                connector_specific_config
-                or ({"file_locations": []} if source == DocumentSource.FILE else {})
-            ),
+            connector_specific_config=connector_specific_config
+            or {"file_locations": []},
            access_type=access_type,
            groups=groups or [],
        )
--- a/backend/tests/integration/common_utils/managers/user.py
+++ b/backend/tests/integration/common_utils/managers/user.py
@@ -88,6 +88,8 @@ class UserManager:
        if not session_cookie:
            raise Exception("Failed to login")

+        print(f"Logged in as {test_user.email}")
+
        # Set cookies in the headers
        test_user.headers["Cookie"] = f"fastapiusersauth={session_cookie}; "
        test_user.cookies = {"fastapiusersauth": session_cookie}
--- a/deployment/data/nginx/app.conf.template
+++ b/deployment/data/nginx/app.conf.template
@@ -4,24 +4,6 @@ log_format custom_main '$remote_addr - $remote_user [$time_local] "$request" '
                '"$http_user_agent" "$http_x_forwarded_for" '
                'rt=$request_time';

-# Map X-Forwarded-Proto or fallback to $scheme
-map $http_x_forwarded_proto $forwarded_proto {
-    default $http_x_forwarded_proto;
-    ""      $scheme;
-}
-
-# Map X-Forwarded-Host or fallback to $host
-map $http_x_forwarded_host $forwarded_host {
-    default $http_x_forwarded_host;
-    ""      $host;
-}
-
-# Map X-Forwarded-Port or fallback to server port
-map $http_x_forwarded_port $forwarded_port {
-    default $http_x_forwarded_port;
-    ""      $server_port;
-}
-
 upstream api_server {
    # fail_timeout=0 means we always retry an upstream even if it failed
    # to return a good HTTP response
@@ -39,7 +21,8 @@ upstream web_server {
 }

 server {
-    listen 80 default_server;
+    listen 80;
+    server_name ${DOMAIN};

    client_max_body_size 5G;    # Maximum upload size

@@ -53,9 +36,8 @@ server {
        # misc headers
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
-        proxy_set_header X-Forwarded-Proto $forwarded_proto;
-        proxy_set_header X-Forwarded-Host $forwarded_host; 
-        proxy_set_header X-Forwarded-Port $forwarded_port;
+        proxy_set_header X-Forwarded-Proto $scheme;
+        proxy_set_header X-Forwarded-Host $host; 
        proxy_set_header Host $host;

        # need to use 1.1 to support chunked transfers
@@ -72,9 +54,8 @@ server {
        # misc headers
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
-        proxy_set_header X-Forwarded-Proto $forwarded_proto;
-        proxy_set_header X-Forwarded-Host $forwarded_host; 
-        proxy_set_header X-Forwarded-Port $forwarded_port;
+        proxy_set_header X-Forwarded-Proto $scheme;
+        proxy_set_header X-Forwarded-Host $host; 
        proxy_set_header Host $host;

        proxy_http_version 1.1;
@@ -91,25 +72,14 @@ server {
 }

 server {
-    listen 443 ssl default_server;
+    listen 443 ssl;
+    server_name ${DOMAIN};

    client_max_body_size 5G;    # Maximum upload size
    
    location / {
-        # misc headers
-        proxy_set_header X-Real-IP $remote_addr;
-        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
-        # don't use forwarded schema, host, or port here - this is the entry point
-        proxy_set_header X-Forwarded-Proto $scheme;
-        proxy_set_header X-Forwarded-Host $host; 
-        proxy_set_header X-Forwarded-Port $server_port;
-        proxy_set_header Host $host;
-
        proxy_http_version 1.1;
        proxy_buffering off;
-        # we don't want nginx trying to do something clever with
-        # redirects, we set the Host: header above already.
-        proxy_redirect off;
        proxy_pass http://localhost:80;
    }

--- a/deployment/data/nginx/app.conf.template.dev
+++ b/deployment/data/nginx/app.conf.template.dev
@@ -21,7 +21,8 @@ upstream web_server {
 }

 server {
-    listen 80 default_server;
+    listen 80;
+    server_name ${DOMAIN};

    client_max_body_size 5G;    # Maximum upload size    

@@ -36,8 +37,7 @@ server {
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_set_header X-Forwarded-Proto $scheme;
-        proxy_set_header X-Forwarded-Host $host;
-        proxy_set_header X-Forwarded-Port $server_port;
+        proxy_set_header X-Forwarded-Host $host; 
        proxy_set_header Host $host;

        # need to use 1.1 to support chunked transfers
@@ -55,8 +55,7 @@ server {
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_set_header X-Forwarded-Proto $scheme;
-        proxy_set_header X-Forwarded-Host $host;
-        proxy_set_header X-Forwarded-Port $server_port;
+        proxy_set_header X-Forwarded-Host $host; 
        proxy_set_header Host $host;

        proxy_http_version 1.1;
--- a/deployment/data/nginx/app.conf.template.no-letsencrypt
+++ b/deployment/data/nginx/app.conf.template.no-letsencrypt
@@ -4,24 +4,6 @@ log_format custom_main '$remote_addr - $remote_user [$time_local] "$request" '
                '"$http_user_agent" "$http_x_forwarded_for" '
                'rt=$request_time';

-# Map X-Forwarded-Proto or fallback to $scheme
-map $http_x_forwarded_proto $forwarded_proto {
-    default $http_x_forwarded_proto;
-    ""      $scheme;
-}
-
-# Map X-Forwarded-Host or fallback to $host
-map $http_x_forwarded_host $forwarded_host {
-    default $http_x_forwarded_host;
-    ""      $host;
-}
-
-# Map X-Forwarded-Port or fallback to server port
-map $http_x_forwarded_port $forwarded_port {
-    default $http_x_forwarded_port;
-    ""      $server_port;
-}
-
 upstream api_server {
    # fail_timeout=0 means we always retry an upstream even if it failed
    # to return a good HTTP response
@@ -39,7 +21,8 @@ upstream web_server {
 }

 server {
-    listen 80 default_server;
+    listen 80;
+    server_name ${DOMAIN};

    client_max_body_size 5G;    # Maximum upload size

@@ -53,9 +36,8 @@ server {
        # misc headers
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
-        proxy_set_header X-Forwarded-Proto $forwarded_proto;
-        proxy_set_header X-Forwarded-Host $forwarded_host; 
-        proxy_set_header X-Forwarded-Port $forwarded_port;
+        proxy_set_header X-Forwarded-Proto $scheme;
+        proxy_set_header X-Forwarded-Host $host; 
        proxy_set_header Host $host;

        # need to use 1.1 to support chunked transfers
@@ -72,9 +54,8 @@ server {
        # misc headers
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
-        proxy_set_header X-Forwarded-Proto $forwarded_proto;
-        proxy_set_header X-Forwarded-Host $forwarded_host; 
-        proxy_set_header X-Forwarded-Port $forwarded_port;
+        proxy_set_header X-Forwarded-Proto $scheme;
+        proxy_set_header X-Forwarded-Host $host; 
        proxy_set_header Host $host;

        proxy_http_version 1.1;
@@ -87,25 +68,14 @@ server {
 }

 server {
-    listen 443 ssl default_server;
+    listen 443 ssl;
+    server_name ${DOMAIN};

    client_max_body_size 5G;    # Maximum upload size
    
    location / {
-        # misc headers
-        proxy_set_header X-Real-IP $remote_addr;
-        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
-        # don't use forwarded schema, host, or port here - this is the entry point
-        proxy_set_header X-Forwarded-Proto $scheme;
-        proxy_set_header X-Forwarded-Host $host; 
-        proxy_set_header X-Forwarded-Port $server_port;
-        proxy_set_header Host $host;
-
        proxy_http_version 1.1;
        proxy_buffering off;
-        # we don't want nginx trying to do something clever with
-        # redirects, we set the Host: header above already.
-        proxy_redirect off;
        proxy_pass http://localhost:80;
    }

--- a/deployment/docker_compose/docker-compose.dev.yml
+++ b/deployment/docker_compose/docker-compose.dev.yml
@@ -36,7 +36,6 @@ services:
      - OPENID_CONFIG_URL=${OPENID_CONFIG_URL:-}
      - TRACK_EXTERNAL_IDP_EXPIRY=${TRACK_EXTERNAL_IDP_EXPIRY:-}
      - CORS_ALLOWED_ORIGIN=${CORS_ALLOWED_ORIGIN:-}
-      - INTEGRATION_TESTS_MODE=${INTEGRATION_TESTS_MODE:-}
      # Gen AI Settings
      - GEN_AI_MAX_TOKENS=${GEN_AI_MAX_TOKENS:-}
      - QA_TIMEOUT=${QA_TIMEOUT:-}
--- a/web/src/app/admin/settings/SettingsForm.tsx
+++ b/web/src/app/admin/settings/SettingsForm.tsx
@@ -240,11 +240,11 @@ export function SettingsForm() {
      />

      <Checkbox
-        label="Agent Search"
-        sublabel="If set, users will be able to use Agent Search."
-        checked={settings.pro_search_enabled ?? true}
+        label="Pro Search Disabled"
+        sublabel="If set, users will not be able to use Pro Search."
+        checked={settings.pro_search_disabled ?? false}
        onChange={(e) =>
-          handleToggleSettingsField("pro_search_enabled", e.target.checked)
+          handleToggleSettingsField("pro_search_disabled", e.target.checked)
        }
      />

--- a/web/src/app/admin/settings/interfaces.ts
+++ b/web/src/app/admin/settings/interfaces.ts
@@ -10,7 +10,7 @@ export interface Settings {
  notifications: Notification[];
  needs_reindexing: boolean;
  gpu_enabled: boolean;
-  pro_search_enabled: boolean | null;
+  pro_search_disabled: boolean | null;
  application_status: ApplicationStatus;
  auto_scroll: boolean;
  temperature_override_enabled: boolean;
--- a/web/src/app/chat/ChatPage.tsx
+++ b/web/src/app/chat/ChatPage.tsx
@@ -23,7 +23,6 @@ import {
  SubQuestionDetail,
  constructSubQuestions,
  DocumentsResponse,
-  AgenticMessageResponseIDInfo,
 } from "./interfaces";

 import Prism from "prismjs";
@@ -47,7 +46,6 @@ import {
  removeMessage,
  sendMessage,
  setMessageAsLatest,
-  updateLlmOverrideForChatSession,
  updateParentChildren,
  uploadFilesForChat,
  useScrollonStream,
@@ -66,7 +64,7 @@ import {
 import { usePopup } from "@/components/admin/connectors/Popup";
 import { SEARCH_PARAM_NAMES, shouldSubmitOnLoad } from "./searchParams";
 import { useDocumentSelection } from "./useDocumentSelection";
-import { LlmDescriptor, useFilters, useLlmManager } from "@/lib/hooks";
+import { LlmOverride, useFilters, useLlmOverride } from "@/lib/hooks";
 import { ChatState, FeedbackType, RegenerationState } from "./types";
 import { DocumentResults } from "./documentSidebar/DocumentResults";
 import { OnyxInitializingLoader } from "@/components/OnyxInitializingLoader";
@@ -90,11 +88,7 @@ import {
 import { buildFilters } from "@/lib/search/utils";
 import { SettingsContext } from "@/components/settings/SettingsProvider";
 import Dropzone from "react-dropzone";
-import {
-  checkLLMSupportsImageInput,
-  getFinalLLM,
-  structureValue,
-} from "@/lib/llm/utils";
+import { checkLLMSupportsImageInput, getFinalLLM } from "@/lib/llm/utils";
 import { ChatInputBar } from "./input/ChatInputBar";
 import { useChatContext } from "@/components/context/ChatContext";
 import { v4 as uuidv4 } from "uuid";
@@ -199,6 +193,16 @@ export function ChatPage({
    return screenSize;
  }

+  const { height: screenHeight } = useScreenSize();
+
+  const getContainerHeight = () => {
+    if (autoScrollEnabled) return undefined;
+
+    if (screenHeight < 600) return "20vh";
+    if (screenHeight < 1200) return "30vh";
+    return "40vh";
+  };
+
  // handle redirect if chat page is disabled
  // NOTE: this must be done here, in a client component since
  // settings are passed in via Context and therefore aren't
@@ -217,7 +221,6 @@ export function ChatPage({
    setProSearchEnabled(!proSearchEnabled);
  };

-  const isInitialLoad = useRef(true);
  const [userSettingsToggled, setUserSettingsToggled] = useState(false);

  const {
@@ -352,7 +355,7 @@ export function ChatPage({
    ]
  );

-  const llmManager = useLlmManager(
+  const llmOverrideManager = useLlmOverride(
    llmProviders,
    selectedChatSession,
    liveAssistant
@@ -516,17 +519,8 @@ export function ChatPage({
      scrollInitialized.current = false;

      if (!hasPerformedInitialScroll) {
-        if (isInitialLoad.current) {
-          setHasPerformedInitialScroll(true);
-          isInitialLoad.current = false;
-        }
        clientScrollToBottom();
-
-        setTimeout(() => {
-          setHasPerformedInitialScroll(true);
-        }, 100);
      } else if (isChatSessionSwitch) {
-        setHasPerformedInitialScroll(true);
        clientScrollToBottom(true);
      }

@@ -1135,56 +1129,6 @@ export function ChatPage({
    });
  };
  const [uncaughtError, setUncaughtError] = useState<string | null>(null);
-  const [agenticGenerating, setAgenticGenerating] = useState(false);
-
-  const autoScrollEnabled =
-    (user?.preferences?.auto_scroll && !agenticGenerating) ?? false;
-
-  useScrollonStream({
-    chatState: currentSessionChatState,
-    scrollableDivRef,
-    scrollDist,
-    endDivRef,
-    debounceNumber,
-    mobile: settings?.isMobile,
-    enableAutoScroll: autoScrollEnabled,
-  });
-
-  // Track whether a message has been sent during this page load, keyed by chat session id
-  const [sessionHasSentLocalUserMessage, setSessionHasSentLocalUserMessage] =
-    useState<Map<string | null, boolean>>(new Map());
-
-  // Update the local state for a session once the user sends a message
-  const markSessionMessageSent = (sessionId: string | null) => {
-    setSessionHasSentLocalUserMessage((prev) => {
-      const newMap = new Map(prev);
-      newMap.set(sessionId, true);
-      return newMap;
-    });
-  };
-  const currentSessionHasSentLocalUserMessage = useMemo(
-    () => (sessionId: string | null) => {
-      return sessionHasSentLocalUserMessage.size === 0
-        ? undefined
-        : sessionHasSentLocalUserMessage.get(sessionId) || false;
-    },
-    [sessionHasSentLocalUserMessage]
-  );
-
-  const { height: screenHeight } = useScreenSize();
-
-  const getContainerHeight = useMemo(() => {
-    return () => {
-      if (!currentSessionHasSentLocalUserMessage(chatSessionIdRef.current)) {
-        return undefined;
-      }
-      if (autoScrollEnabled) return undefined;
-
-      if (screenHeight < 600) return "40vh";
-      if (screenHeight < 1200) return "50vh";
-      return "60vh";
-    };
-  }, [autoScrollEnabled, screenHeight, currentSessionHasSentLocalUserMessage]);

  const onSubmit = async ({
    messageIdToResend,
@@ -1193,7 +1137,7 @@ export function ChatPage({
    forceSearch,
    isSeededChat,
    alternativeAssistantOverride = null,
-    modelOverride,
+    modelOverRide,
    regenerationRequest,
    overrideFileDescriptors,
  }: {
@@ -1203,7 +1147,7 @@ export function ChatPage({
    forceSearch?: boolean;
    isSeededChat?: boolean;
    alternativeAssistantOverride?: Persona | null;
-    modelOverride?: LlmDescriptor;
+    modelOverRide?: LlmOverride;
    regenerationRequest?: RegenerationRequest | null;
    overrideFileDescriptors?: FileDescriptor[];
  } = {}) => {
@@ -1211,9 +1155,6 @@ export function ChatPage({
    let frozenSessionId = currentSessionId();
    updateCanContinue(false, frozenSessionId);

-    // Mark that we've sent a message for this session in the current page load
-    markSessionMessageSent(frozenSessionId);
-
    if (currentChatState() != "input") {
      if (currentChatState() == "uploading") {
        setPopup({
@@ -1249,22 +1190,6 @@ export function ChatPage({
      currChatSessionId = chatSessionIdRef.current as string;
    }
    frozenSessionId = currChatSessionId;
-    // update the selected model for the chat session if one is specified so that
-    // it persists across page reloads. Do not `await` here so that the message
-    // request can continue and this will just happen in the background.
-    // NOTE: only set the model override for the chat session once we send a
-    // message with it. If the user switches models and then starts a new
-    // chat session, it is unexpected for that model to be used when they
-    // return to this session the next day.
-    let finalLLM = modelOverride || llmManager.currentLlm;
-    updateLlmOverrideForChatSession(
-      currChatSessionId,
-      structureValue(
-        finalLLM.name || "",
-        finalLLM.provider || "",
-        finalLLM.modelName || ""
-      )
-    );

    updateStatesWithNewSessionId(currChatSessionId);

@@ -1324,14 +1249,11 @@ export function ChatPage({
        : null) ||
      (messageMap.size === 1 ? Array.from(messageMap.values())[0] : null);

-    let currentAssistantId;
-    if (alternativeAssistantOverride) {
-      currentAssistantId = alternativeAssistantOverride.id;
-    } else if (alternativeAssistant) {
-      currentAssistantId = alternativeAssistant.id;
-    } else {
-      currentAssistantId = liveAssistant.id;
-    }
+    const currentAssistantId = alternativeAssistantOverride
+      ? alternativeAssistantOverride.id
+      : alternativeAssistant
+        ? alternativeAssistant.id
+        : liveAssistant.id;

    resetInputBar();
    let messageUpdates: Message[] | null = null;
@@ -1358,8 +1280,6 @@ export function ChatPage({
    let toolCall: ToolCallMetadata | null = null;
    let isImprovement: boolean | undefined = undefined;
    let isStreamingQuestions = true;
-    let includeAgentic = false;
-    let secondLevelMessageId: number | null = null;

    let initialFetchDetails: null | {
      user_message_id: number;
@@ -1403,18 +1323,20 @@ export function ChatPage({
        forceSearch,
        regenerate: regenerationRequest !== undefined,
        modelProvider:
-          modelOverride?.name || llmManager.currentLlm.name || undefined,
+          modelOverRide?.name ||
+          llmOverrideManager.llmOverride.name ||
+          undefined,
        modelVersion:
-          modelOverride?.modelName ||
-          llmManager.currentLlm.modelName ||
+          modelOverRide?.modelName ||
+          llmOverrideManager.llmOverride.modelName ||
          searchParams.get(SEARCH_PARAM_NAMES.MODEL_VERSION) ||
          undefined,
-        temperature: llmManager.temperature || undefined,
+        temperature: llmOverrideManager.temperature || undefined,
        systemPromptOverride:
          searchParams.get(SEARCH_PARAM_NAMES.SYSTEM_PROMPT) || undefined,
        useExistingUserMessage: isSeededChat,
        useLanggraph:
-          settings?.settings.pro_search_enabled &&
+          !settings?.settings.pro_search_disabled &&
          proSearchEnabled &&
          retrievalEnabled,
      });
@@ -1495,17 +1417,6 @@ export function ChatPage({
            resetRegenerationState();
          } else {
            const { user_message_id, frozenMessageMap } = initialFetchDetails;
-            if (Object.hasOwn(packet, "agentic_message_ids")) {
-              const agenticMessageIds = (packet as AgenticMessageResponseIDInfo)
-                .agentic_message_ids;
-              const level1MessageId = agenticMessageIds.find(
-                (item) => item.level === 1
-              )?.message_id;
-              if (level1MessageId) {
-                secondLevelMessageId = level1MessageId;
-                includeAgentic = true;
-              }
-            }

            setChatState((prevState) => {
              if (prevState.get(chatSessionIdRef.current!) === "loading") {
@@ -1657,10 +1568,7 @@ export function ChatPage({
                  };
                }
              );
-            } else if (
-              Object.hasOwn(packet, "error") &&
-              (packet as any).error != null
-            ) {
+            } else if (Object.hasOwn(packet, "error")) {
              if (
                sub_questions.length > 0 &&
                sub_questions
@@ -1672,8 +1580,8 @@ export function ChatPage({
                setAgenticGenerating(false);
                setAlternativeGeneratingAssistant(null);
                setSubmittedMessage("");
-
-                throw new Error((packet as StreamingError).error);
+                return;
+                // throw new Error((packet as StreamingError).error);
              } else {
                error = (packet as StreamingError).error;
                stackTrace = (packet as StreamingError).stack_trace;
@@ -1756,19 +1664,6 @@ export function ChatPage({
                second_level_generating: second_level_generating,
                agentic_docs: agenticDocs,
              },
-              ...(includeAgentic
-                ? [
-                    {
-                      messageId: secondLevelMessageId!,
-                      message: second_level_answer,
-                      type: "assistant" as const,
-                      files: [],
-                      toolCall: null,
-                      parentMessageId:
-                        initialFetchDetails.assistant_message_id!,
-                    },
-                  ]
-                : []),
            ]);
          }
        }
@@ -1877,7 +1772,7 @@ export function ChatPage({
    const [_, llmModel] = getFinalLLM(
      llmProviders,
      liveAssistant,
-      llmManager.currentLlm
+      llmOverrideManager.llmOverride
    );
    const llmAcceptsImages = checkLLMSupportsImageInput(llmModel);

@@ -1932,6 +1827,7 @@ export function ChatPage({
  // Used to maintain a "time out" for history sidebar so our existing refs can have time to process change
  const [untoggled, setUntoggled] = useState(false);
  const [loadingError, setLoadingError] = useState<string | null>(null);
+  const [agenticGenerating, setAgenticGenerating] = useState(false);

  const explicitlyUntoggle = () => {
    setShowHistorySidebar(false);
@@ -1973,6 +1869,19 @@ export function ChatPage({
    isAnonymousUser: user?.is_anonymous_user,
  });

+  const autoScrollEnabled =
+    (user?.preferences?.auto_scroll && !agenticGenerating) ?? false;
+
+  useScrollonStream({
+    chatState: currentSessionChatState,
+    scrollableDivRef,
+    scrollDist,
+    endDivRef,
+    debounceNumber,
+    mobile: settings?.isMobile,
+    enableAutoScroll: autoScrollEnabled,
+  });
+
  // Virtualization + Scrolling related effects and functions
  const scrollInitialized = useRef(false);
  interface VisibleRange {
@@ -2182,7 +2091,7 @@ export function ChatPage({
  }, [searchParams, router]);

  useEffect(() => {
-    llmManager.updateImageFilesPresent(imageFileInMessageHistory);
+    llmOverrideManager.updateImageFilesPresent(imageFileInMessageHistory);
  }, [imageFileInMessageHistory]);

  const pathname = usePathname();
@@ -2236,9 +2145,9 @@ export function ChatPage({

  function createRegenerator(regenerationRequest: RegenerationRequest) {
    // Returns new function that only needs `modelOverRide` to be specified when called
-    return async function (modelOverride: LlmDescriptor) {
+    return async function (modelOverRide: LlmOverride) {
      return await onSubmit({
-        modelOverride,
+        modelOverRide,
        messageIdToResend: regenerationRequest.parentMessage.messageId,
        regenerationRequest,
        forceSearch: regenerationRequest.forceSearch,
@@ -2319,7 +2228,9 @@ export function ChatPage({
      {(settingsToggled || userSettingsToggled) && (
        <UserSettingsModal
          setPopup={setPopup}
-          setCurrentLlm={(newLlm) => llmManager.updateCurrentLlm(newLlm)}
+          setLlmOverride={(newOverride) =>
+            llmOverrideManager.updateLLMOverride(newOverride)
+          }
          defaultModel={user?.preferences.default_model!}
          llmProviders={llmProviders}
          onClose={() => {
@@ -2383,7 +2294,7 @@ export function ChatPage({
        <ShareChatSessionModal
          assistantId={liveAssistant?.id}
          message={message}
-          modelOverride={llmManager.currentLlm}
+          modelOverride={llmOverrideManager.llmOverride}
          chatSessionId={sharedChatSession.id}
          existingSharedStatus={sharedChatSession.shared_status}
          onClose={() => setSharedChatSession(null)}
@@ -2401,7 +2312,7 @@ export function ChatPage({
        <ShareChatSessionModal
          message={message}
          assistantId={liveAssistant?.id}
-          modelOverride={llmManager.currentLlm}
+          modelOverride={llmOverrideManager.llmOverride}
          chatSessionId={chatSessionIdRef.current}
          existingSharedStatus={chatSessionSharedStatus}
          onClose={() => setSharingModalVisible(false)}
@@ -2631,7 +2542,6 @@ export function ChatPage({
                            style={{ overflowAnchor: "none" }}
                            key={currentSessionId()}
                            className={
-                              (hasPerformedInitialScroll ? "" : " hidden ") +
                              "desktop:-ml-4 w-full mx-auto " +
                              "absolute mobile:top-0 desktop:top-0 left-0 " +
                              (settings?.enterpriseSettings
@@ -2782,11 +2692,6 @@ export function ChatPage({
                                    ? messageHistory[i + 1]?.documents
                                    : undefined;

-                                const nextMessage =
-                                  messageHistory[i + 1]?.type === "assistant"
-                                    ? messageHistory[i + 1]
-                                    : undefined;
-
                                return (
                                  <div
                                    className="text-text"
@@ -2815,10 +2720,7 @@ export function ChatPage({
                                            selectedMessageForDocDisplay ==
                                              secondLevelMessage?.messageId)
                                        }
-                                        isImprovement={
-                                          message.isImprovement ||
-                                          nextMessage?.isImprovement
-                                        }
+                                        isImprovement={message.isImprovement}
                                        secondLevelGenerating={
                                          (message.second_level_generating &&
                                            currentSessionChatState !==
@@ -3118,7 +3020,7 @@ export function ChatPage({
                                              messageId: message.messageId,
                                              parentMessage: parentMessage!,
                                              forceSearch: true,
-                                            })(llmManager.currentLlm);
+                                            })(llmOverrideManager.llmOverride);
                                          } else {
                                            setPopup({
                                              type: "error",
@@ -3263,7 +3165,7 @@ export function ChatPage({
                              availableDocumentSets={documentSets}
                              availableTags={tags}
                              filterManager={filterManager}
-                              llmManager={llmManager}
+                              llmOverrideManager={llmOverrideManager}
                              removeDocs={() => {
                                clearSelectedDocuments();
                              }}
--- a/web/src/app/chat/RegenerateOption.tsx
+++ b/web/src/app/chat/RegenerateOption.tsx
@@ -1,8 +1,8 @@
 import { useChatContext } from "@/components/context/ChatContext";
 import {
  getDisplayNameForModel,
-  LlmDescriptor,
-  useLlmManager,
+  LlmOverride,
+  useLlmOverride,
 } from "@/lib/hooks";
 import { StringOrNumberOption } from "@/components/Dropdown";

@@ -106,13 +106,13 @@ export default function RegenerateOption({
  onDropdownVisibleChange,
 }: {
  selectedAssistant: Persona;
-  regenerate: (modelOverRide: LlmDescriptor) => Promise<void>;
+  regenerate: (modelOverRide: LlmOverride) => Promise<void>;
  overriddenModel?: string;
  onHoverChange: (isHovered: boolean) => void;
  onDropdownVisibleChange: (isVisible: boolean) => void;
 }) {
  const { llmProviders } = useChatContext();
-  const llmManager = useLlmManager(llmProviders);
+  const llmOverrideManager = useLlmOverride(llmProviders);

  const [_, llmName] = getFinalLLM(llmProviders, selectedAssistant, null);

@@ -148,7 +148,7 @@ export default function RegenerateOption({
  );

  const currentModelName =
-    llmManager?.currentLlm.modelName ||
+    llmOverrideManager?.llmOverride.modelName ||
    (selectedAssistant
      ? selectedAssistant.llm_model_version_override || llmName
      : llmName);
--- a/web/src/app/chat/input/ChatInputBar.tsx
+++ b/web/src/app/chat/input/ChatInputBar.tsx
@@ -6,7 +6,7 @@ import { Persona } from "@/app/admin/assistants/interfaces";
 import LLMPopover from "./LLMPopover";
 import { InputPrompt } from "@/app/chat/interfaces";

-import { FilterManager, LlmManager } from "@/lib/hooks";
+import { FilterManager, LlmOverrideManager } from "@/lib/hooks";
 import { useChatContext } from "@/components/context/ChatContext";
 import { ChatFileType, FileDescriptor } from "../interfaces";
 import {
@@ -180,7 +180,7 @@ interface ChatInputBarProps {
  setMessage: (message: string) => void;
  stopGenerating: () => void;
  onSubmit: () => void;
-  llmManager: LlmManager;
+  llmOverrideManager: LlmOverrideManager;
  chatState: ChatState;
  alternativeAssistant: Persona | null;
  // assistants
@@ -225,7 +225,7 @@ export function ChatInputBar({
  availableSources,
  availableDocumentSets,
  availableTags,
-  llmManager,
+  llmOverrideManager,
  proSearchEnabled,
  setProSearchEnabled,
 }: ChatInputBarProps) {
@@ -781,7 +781,7 @@ export function ChatInputBar({

                <LLMPopover
                  llmProviders={llmProviders}
-                  llmManager={llmManager}
+                  llmOverrideManager={llmOverrideManager}
                  requiresImageGeneration={false}
                  currentAssistant={selectedAssistant}
                />
@@ -805,12 +805,13 @@ export function ChatInputBar({
                )}
              </div>
              <div className="flex items-center my-auto">
-                {retrievalEnabled && settings?.settings.pro_search_enabled && (
-                  <AgenticToggle
-                    proSearchEnabled={proSearchEnabled}
-                    setProSearchEnabled={setProSearchEnabled}
-                  />
-                )}
+                {retrievalEnabled &&
+                  !settings?.settings.pro_search_disabled && (
+                    <AgenticToggle
+                      proSearchEnabled={proSearchEnabled}
+                      setProSearchEnabled={setProSearchEnabled}
+                    />
+                  )}
                <button
                  id="onyx-chat-input-send-button"
                  className={`cursor-pointer ${
--- a/web/src/app/chat/input/LLMPopover.tsx
+++ b/web/src/app/chat/input/LLMPopover.tsx
@@ -16,7 +16,7 @@ import {
  LLMProviderDescriptor,
 } from "@/app/admin/configuration/llm/interfaces";
 import { Persona } from "@/app/admin/assistants/interfaces";
-import { LlmManager } from "@/lib/hooks";
+import { LlmOverrideManager } from "@/lib/hooks";

 import {
  Tooltip,
@@ -31,19 +31,21 @@ import { useUser } from "@/components/user/UserProvider";

 interface LLMPopoverProps {
  llmProviders: LLMProviderDescriptor[];
-  llmManager: LlmManager;
+  llmOverrideManager: LlmOverrideManager;
  requiresImageGeneration?: boolean;
  currentAssistant?: Persona;
 }

 export default function LLMPopover({
  llmProviders,
-  llmManager,
+  llmOverrideManager,
  requiresImageGeneration,
  currentAssistant,
 }: LLMPopoverProps) {
  const [isOpen, setIsOpen] = useState(false);
  const { user } = useUser();
+  const { llmOverride, updateLLMOverride } = llmOverrideManager;
+  const currentLlm = llmOverride.modelName;

  const llmOptionsByProvider: {
    [provider: string]: {
@@ -91,19 +93,19 @@ export default function LLMPopover({
    : null;

  const [localTemperature, setLocalTemperature] = useState(
-    llmManager.temperature ?? 0.5
+    llmOverrideManager.temperature ?? 0.5
  );

  useEffect(() => {
-    setLocalTemperature(llmManager.temperature ?? 0.5);
-  }, [llmManager.temperature]);
+    setLocalTemperature(llmOverrideManager.temperature ?? 0.5);
+  }, [llmOverrideManager.temperature]);

  const handleTemperatureChange = (value: number[]) => {
    setLocalTemperature(value[0]);
  };

  const handleTemperatureChangeComplete = (value: number[]) => {
-    llmManager.updateTemperature(value[0]);
+    llmOverrideManager.updateTemperature(value[0]);
  };

  return (
@@ -118,15 +120,15 @@ export default function LLMPopover({
            toggle
            flexPriority="stiff"
            name={getDisplayNameForModel(
-              llmManager?.currentLlm.modelName ||
+              llmOverrideManager?.llmOverride.modelName ||
                defaultModelDisplayName ||
                "Models"
            )}
            Icon={getProviderIcon(
-              llmManager?.currentLlm.provider ||
+              llmOverrideManager?.llmOverride.provider ||
                defaultProvider?.provider ||
                "anthropic",
-              llmManager?.currentLlm.modelName ||
+              llmOverrideManager?.llmOverride.modelName ||
                defaultProvider?.default_model_name ||
                "claude-3-5-sonnet-20240620"
            )}
@@ -145,12 +147,12 @@ export default function LLMPopover({
                <button
                  key={index}
                  className={`w-full flex items-center gap-x-2 px-3 py-2 text-sm text-left hover:bg-background-100 dark:hover:bg-neutral-800 transition-colors duration-150 ${
-                    llmManager.currentLlm.modelName === name
+                    currentLlm === name
                      ? "bg-background-100 dark:bg-neutral-900 text-text"
                      : "text-text-darker"
                  }`}
                  onClick={() => {
-                    llmManager.updateCurrentLlm(destructureValue(value));
+                    updateLLMOverride(destructureValue(value));
                    setIsOpen(false);
                  }}
                >
@@ -170,7 +172,7 @@ export default function LLMPopover({
                      );
                    }
                  })()}
-                  {llmManager.imageFilesPresent &&
+                  {llmOverrideManager.imageFilesPresent &&
                    !checkLLMSupportsImageInput(name) && (
                      <TooltipProvider>
                        <Tooltip delayDuration={0}>
@@ -197,7 +199,7 @@ export default function LLMPopover({
            <div className="w-full px-3 py-2">
              <Slider
                value={[localTemperature]}
-                max={llmManager.maxTemperature}
+                max={llmOverrideManager.maxTemperature}
                min={0}
                step={0.01}
                onValueChange={handleTemperatureChange}
--- a/web/src/app/chat/interfaces.ts
+++ b/web/src/app/chat/interfaces.ts
@@ -155,15 +155,6 @@ export interface MessageResponseIDInfo {
  reserved_assistant_message_id: number;
 }

-export interface AgentMessageIDInfo {
-  level: number;
-  message_id: number;
-}
-
-export interface AgenticMessageResponseIDInfo {
-  agentic_message_ids: AgentMessageIDInfo[];
-}
-
 export interface DocumentsResponse {
  top_documents: OnyxDocument[];
  rephrased_query: string | null;
--- a/web/src/app/chat/lib.tsx
+++ b/web/src/app/chat/lib.tsx
@@ -25,7 +25,6 @@ import {
  RetrievalType,
  StreamingError,
  ToolCallMetadata,
-  AgenticMessageResponseIDInfo,
 } from "./interfaces";
 import { Persona } from "../admin/assistants/interfaces";
 import { ReadonlyURLSearchParams } from "next/navigation";
@@ -65,7 +64,7 @@ export function getChatRetentionInfo(
  };
 }

-export async function updateLlmOverrideForChatSession(
+export async function updateModelOverrideForChatSession(
  chatSessionId: string,
  newAlternateModel: string
 ) {
@@ -155,8 +154,7 @@ export type PacketType =
  | AgentAnswerPiece
  | SubQuestionPiece
  | ExtendedToolResponse
-  | RefinedAnswerImprovement
-  | AgenticMessageResponseIDInfo;
+  | RefinedAnswerImprovement;

 export async function* sendMessage({
  regenerate,
@@ -236,7 +234,7 @@ export async function* sendMessage({
          }
        : null,
    use_existing_user_message: useExistingUserMessage,
-    use_agentic_search: useLanggraph ?? false,
+    use_agentic_search: useLanggraph,
  });

  const response = await fetch(`/api/chat/send-message`, {
--- a/web/src/app/chat/message/AgenticMessage.tsx
+++ b/web/src/app/chat/message/AgenticMessage.tsx
@@ -44,7 +44,7 @@ import { ValidSources } from "@/lib/types";
 import { useMouseTracking } from "./hooks";
 import { SettingsContext } from "@/components/settings/SettingsProvider";
 import RegenerateOption from "../RegenerateOption";
-import { LlmDescriptor } from "@/lib/hooks";
+import { LlmOverride } from "@/lib/hooks";
 import { ContinueGenerating } from "./ContinueMessage";
 import { MemoizedAnchor, MemoizedParagraph } from "./MemoizedTextComponents";
 import { extractCodeText, preprocessLaTeX } from "./codeUtils";
@@ -117,7 +117,7 @@ export const AgenticMessage = ({
  isComplete?: boolean;
  handleFeedback?: (feedbackType: FeedbackType) => void;
  overriddenModel?: string;
-  regenerate?: (modelOverRide: LlmDescriptor) => Promise<void>;
+  regenerate?: (modelOverRide: LlmOverride) => Promise<void>;
  setPresentingDocument?: (document: OnyxDocument) => void;
  toggleDocDisplay?: (agentic: boolean) => void;
  error?: string | null;
--- a/web/src/app/chat/message/Messages.tsx
+++ b/web/src/app/chat/message/Messages.tsx
@@ -58,7 +58,7 @@ import { useMouseTracking } from "./hooks";
 import { SettingsContext } from "@/components/settings/SettingsProvider";
 import GeneratingImageDisplay from "../tools/GeneratingImageDisplay";
 import RegenerateOption from "../RegenerateOption";
-import { LlmDescriptor } from "@/lib/hooks";
+import { LlmOverride } from "@/lib/hooks";
 import { ContinueGenerating } from "./ContinueMessage";
 import { MemoizedAnchor, MemoizedParagraph } from "./MemoizedTextComponents";
 import { extractCodeText, preprocessLaTeX } from "./codeUtils";
@@ -213,7 +213,7 @@ export const AIMessage = ({
  handleForceSearch?: () => void;
  retrievalDisabled?: boolean;
  overriddenModel?: string;
-  regenerate?: (modelOverRide: LlmDescriptor) => Promise<void>;
+  regenerate?: (modelOverRide: LlmOverride) => Promise<void>;
  setPresentingDocument: (document: OnyxDocument) => void;
  removePadding?: boolean;
 }) => {
--- a/web/src/app/chat/modal/ShareChatSessionModal.tsx
+++ b/web/src/app/chat/modal/ShareChatSessionModal.tsx
@@ -11,7 +11,7 @@ import { CopyButton } from "@/components/CopyButton";
 import { SEARCH_PARAM_NAMES } from "../searchParams";
 import { usePopup } from "@/components/admin/connectors/Popup";
 import { structureValue } from "@/lib/llm/utils";
-import { LlmDescriptor } from "@/lib/hooks";
+import { LlmOverride } from "@/lib/hooks";
 import { Separator } from "@/components/ui/separator";
 import { AdvancedOptionsToggle } from "@/components/AdvancedOptionsToggle";

@@ -38,7 +38,7 @@ async function generateShareLink(chatSessionId: string) {
 async function generateSeedLink(
  message?: string,
  assistantId?: number,
-  modelOverride?: LlmDescriptor
+  modelOverride?: LlmOverride
 ) {
  const baseUrl = `${window.location.protocol}//${window.location.host}`;
  const model = modelOverride
@@ -92,7 +92,7 @@ export function ShareChatSessionModal({
  onClose: () => void;
  message?: string;
  assistantId?: number;
-  modelOverride?: LlmDescriptor;
+  modelOverride?: LlmOverride;
 }) {
  const [shareLink, setShareLink] = useState<string>(
    existingSharedStatus === ChatSessionSharedStatus.Public
--- a/web/src/app/chat/modal/UserSettingsModal.tsx
+++ b/web/src/app/chat/modal/UserSettingsModal.tsx
@@ -1,6 +1,6 @@
 import { useContext, useEffect, useRef, useState } from "react";
 import { Modal } from "@/components/Modal";
-import { getDisplayNameForModel, LlmDescriptor } from "@/lib/hooks";
+import { getDisplayNameForModel, LlmOverride } from "@/lib/hooks";
 import { LLMProviderDescriptor } from "@/app/admin/configuration/llm/interfaces";

 import { destructureValue, structureValue } from "@/lib/llm/utils";
@@ -31,12 +31,12 @@ export function UserSettingsModal({
  setPopup,
  llmProviders,
  onClose,
-  setCurrentLlm,
+  setLlmOverride,
  defaultModel,
 }: {
  setPopup: (popupSpec: PopupSpec | null) => void;
  llmProviders: LLMProviderDescriptor[];
-  setCurrentLlm?: (newLlm: LlmDescriptor) => void;
+  setLlmOverride?: (newOverride: LlmOverride) => void;
  onClose: () => void;
  defaultModel: string | null;
 }) {
@@ -127,14 +127,18 @@ export function UserSettingsModal({
    );
  });

+  const llmOptions = Object.entries(llmOptionsByProvider).flatMap(
+    ([provider, options]) => [...options]
+  );
+
  const router = useRouter();
  const handleChangedefaultModel = async (defaultModel: string | null) => {
    try {
      const response = await setUserDefaultModel(defaultModel);

      if (response.ok) {
-        if (defaultModel && setCurrentLlm) {
-          setCurrentLlm(destructureValue(defaultModel));
+        if (defaultModel && setLlmOverride) {
+          setLlmOverride(destructureValue(defaultModel));
        }
        setPopup({
          message: "Default model updated successfully",
--- a/web/src/app/layout.tsx
+++ b/web/src/app/layout.tsx
@@ -21,9 +21,11 @@ import { fetchAssistantData } from "@/lib/chat/fetchAssistantdata";
 import { AppProvider } from "@/components/context/AppProvider";
 import { PHProvider } from "./providers";
 import { getCurrentUserSS } from "@/lib/userSS";
+import CardSection from "@/components/admin/CardSection";
 import { Suspense } from "react";
 import PostHogPageView from "./PostHogPageView";
 import Script from "next/script";
+import { LogoType } from "@/components/logo/Logo";
 import { Hanken_Grotesk } from "next/font/google";
 import { WebVitals } from "./web-vitals";
 import { ThemeProvider } from "next-themes";
--- a/web/src/components/settings/lib.ts
+++ b/web/src/components/settings/lib.ts
@@ -51,7 +51,7 @@ export async function fetchSettingsSS(): Promise<CombinedSettings | null> {
          notifications: [],
          needs_reindexing: false,
          anonymous_user_enabled: false,
-          pro_search_enabled: true,
+          pro_search_disabled: false,
          temperature_override_enabled: true,
        };
      } else {
@@ -95,8 +95,8 @@ export async function fetchSettingsSS(): Promise<CombinedSettings | null> {
      }
    }

-    if (settings.pro_search_enabled == null) {
-      settings.pro_search_enabled = true;
+    if (enterpriseSettings && settings.pro_search_disabled == null) {
+      settings.pro_search_disabled = true;
    }

    const webVersion = getWebVersion();
--- a/web/src/lib/hooks.ts
+++ b/web/src/lib/hooks.ts
@@ -360,18 +360,18 @@ export const useUsers = ({ includeApiKeys }: UseUsersParams) => {
  };
 };

-export interface LlmDescriptor {
+export interface LlmOverride {
  name: string;
  provider: string;
  modelName: string;
 }

-export interface LlmManager {
-  currentLlm: LlmDescriptor;
-  updateCurrentLlm: (newOverride: LlmDescriptor) => void;
+export interface LlmOverrideManager {
+  llmOverride: LlmOverride;
+  updateLLMOverride: (newOverride: LlmOverride) => void;
  temperature: number;
  updateTemperature: (temperature: number) => void;
-  updateModelOverrideBasedOnChatSession: (chatSession?: ChatSession) => void;
+  updateModelOverrideForChatSession: (chatSession?: ChatSession) => void;
  imageFilesPresent: boolean;
  updateImageFilesPresent: (present: boolean) => void;
  liveAssistant: Persona | null;
@@ -400,7 +400,7 @@ Thus, the input should be

 Changes take place as
 - liveAssistant or currentChatSession changes (and the associated model override is set)
- (updateCurrentLlm) User explicitly setting a model override (and we explicitly override and set the userSpecifiedOverride which we'll use in place of the user preferences unless overridden by an assistant)
+- (uploadLLMOverride) User explicitly setting a model override (and we explicitly override and set the userSpecifiedOverride which we'll use in place of the user preferences unless overridden by an assistant)

 If we have a live assistant, we should use that model override

@@ -419,78 +419,55 @@ This approach ensures that user preferences are maintained for existing chats wh
 providing appropriate defaults for new conversations based on the available tools.
 */

-export function useLlmManager(
+export function useLlmOverride(
  llmProviders: LLMProviderDescriptor[],
  currentChatSession?: ChatSession,
  liveAssistant?: Persona
-): LlmManager {
+): LlmOverrideManager {
  const { user } = useUser();

-  const [userHasManuallyOverriddenLLM, setUserHasManuallyOverriddenLLM] =
-    useState(false);
  const [chatSession, setChatSession] = useState<ChatSession | null>(null);
-  const [currentLlm, setCurrentLlm] = useState<LlmDescriptor>({
-    name: "",
-    provider: "",
-    modelName: "",
-  });

-  const llmUpdate = () => {
-    /* Should be called when the live assistant or current chat session changes */
+  const llmOverrideUpdate = () => {
+    if (liveAssistant?.llm_model_version_override) {
+      setLlmOverride(
+        getValidLlmOverride(liveAssistant.llm_model_version_override)
+      );
+    } else if (currentChatSession?.current_alternate_model) {
+      setLlmOverride(
+        getValidLlmOverride(currentChatSession.current_alternate_model)
+      );
+    } else if (user?.preferences?.default_model) {
+      setLlmOverride(getValidLlmOverride(user.preferences.default_model));
+      return;
+    } else {
+      const defaultProvider = llmProviders.find(
+        (provider) => provider.is_default_provider
+      );

-    // separate function so we can `return` to break out
-    const _llmUpdate = () => {
-      // if the user has overridden in this session and just switched to a brand
-      // new session, use their manually specified model
-      if (userHasManuallyOverriddenLLM && !currentChatSession) {
-        return;
+      if (defaultProvider) {
+        setLlmOverride({
+          name: defaultProvider.name,
+          provider: defaultProvider.provider,
+          modelName: defaultProvider.default_model_name,
+        });
      }
-
-      if (currentChatSession?.current_alternate_model) {
-        setCurrentLlm(
-          getValidLlmDescriptor(currentChatSession.current_alternate_model)
-        );
-      } else if (liveAssistant?.llm_model_version_override) {
-        setCurrentLlm(
-          getValidLlmDescriptor(liveAssistant.llm_model_version_override)
-        );
-      } else if (userHasManuallyOverriddenLLM) {
-        // if the user has an override and there's nothing special about the
-        // current chat session, use the override
-        return;
-      } else if (user?.preferences?.default_model) {
-        setCurrentLlm(getValidLlmDescriptor(user.preferences.default_model));
-      } else {
-        const defaultProvider = llmProviders.find(
-          (provider) => provider.is_default_provider
-        );
-
-        if (defaultProvider) {
-          setCurrentLlm({
-            name: defaultProvider.name,
-            provider: defaultProvider.provider,
-            modelName: defaultProvider.default_model_name,
-          });
-        }
-      }
-    };
-
-    _llmUpdate();
+    }
    setChatSession(currentChatSession || null);
  };

-  const getValidLlmDescriptor = (
-    modelName: string | null | undefined
-  ): LlmDescriptor => {
-    if (modelName) {
-      const model = destructureValue(modelName);
+  const getValidLlmOverride = (
+    overrideModel: string | null | undefined
+  ): LlmOverride => {
+    if (overrideModel) {
+      const model = destructureValue(overrideModel);
      if (!(model.modelName && model.modelName.length > 0)) {
        const provider = llmProviders.find((p) =>
-          p.model_names.includes(modelName)
+          p.model_names.includes(overrideModel)
        );
        if (provider) {
          return {
-            modelName: modelName,
+            modelName: overrideModel,
            name: provider.name,
            provider: provider.provider,
          };
@@ -514,32 +491,38 @@ export function useLlmManager(
    setImageFilesPresent(present);
  };

-  // Manually set the LLM
-  const updateCurrentLlm = (newLlm: LlmDescriptor) => {
+  const [llmOverride, setLlmOverride] = useState<LlmOverride>({
+    name: "",
+    provider: "",
+    modelName: "",
+  });
+
+  // Manually set the override
+  const updateLLMOverride = (newOverride: LlmOverride) => {
    const provider =
-      newLlm.provider || findProviderForModel(llmProviders, newLlm.modelName);
+      newOverride.provider ||
+      findProviderForModel(llmProviders, newOverride.modelName);
    const structuredValue = structureValue(
-      newLlm.name,
+      newOverride.name,
      provider,
-      newLlm.modelName
+      newOverride.modelName
    );
-    setCurrentLlm(getValidLlmDescriptor(structuredValue));
-    setUserHasManuallyOverriddenLLM(true);
+    setLlmOverride(getValidLlmOverride(structuredValue));
  };

-  const updateModelOverrideBasedOnChatSession = (chatSession?: ChatSession) => {
+  const updateModelOverrideForChatSession = (chatSession?: ChatSession) => {
    if (chatSession && chatSession.current_alternate_model?.length > 0) {
-      setCurrentLlm(getValidLlmDescriptor(chatSession.current_alternate_model));
+      setLlmOverride(getValidLlmOverride(chatSession.current_alternate_model));
    }
  };

  const [temperature, setTemperature] = useState<number>(() => {
-    llmUpdate();
+    llmOverrideUpdate();

    if (currentChatSession?.current_temperature_override != null) {
      return Math.min(
        currentChatSession.current_temperature_override,
-        isAnthropic(currentLlm.provider, currentLlm.modelName) ? 1.0 : 2.0
+        isAnthropic(llmOverride.provider, llmOverride.modelName) ? 1.0 : 2.0
      );
    } else if (
      liveAssistant?.tools.some((tool) => tool.name === SEARCH_TOOL_ID)
@@ -550,23 +533,22 @@ export function useLlmManager(
  });

  const maxTemperature = useMemo(() => {
-    return isAnthropic(currentLlm.provider, currentLlm.modelName) ? 1.0 : 2.0;
-  }, [currentLlm]);
+    return isAnthropic(llmOverride.provider, llmOverride.modelName) ? 1.0 : 2.0;
+  }, [llmOverride]);

  useEffect(() => {
-    if (isAnthropic(currentLlm.provider, currentLlm.modelName)) {
+    if (isAnthropic(llmOverride.provider, llmOverride.modelName)) {
      const newTemperature = Math.min(temperature, 1.0);
      setTemperature(newTemperature);
      if (chatSession?.id) {
        updateTemperatureOverrideForChatSession(chatSession.id, newTemperature);
      }
    }
-  }, [currentLlm]);
+  }, [llmOverride]);

  useEffect(() => {
-    llmUpdate();
-
    if (!chatSession && currentChatSession) {
+      setChatSession(currentChatSession || null);
      if (temperature) {
        updateTemperatureOverrideForChatSession(
          currentChatSession.id,
@@ -588,7 +570,7 @@ export function useLlmManager(
  }, [liveAssistant, currentChatSession]);

  const updateTemperature = (temperature: number) => {
-    if (isAnthropic(currentLlm.provider, currentLlm.modelName)) {
+    if (isAnthropic(llmOverride.provider, llmOverride.modelName)) {
      setTemperature((prevTemp) => Math.min(temperature, 1.0));
    } else {
      setTemperature(temperature);
@@ -599,9 +581,9 @@ export function useLlmManager(
  };

  return {
-    updateModelOverrideBasedOnChatSession,
-    currentLlm,
-    updateCurrentLlm,
+    updateModelOverrideForChatSession,
+    llmOverride,
+    updateLLMOverride,
    temperature,
    updateTemperature,
    imageFilesPresent,
--- a/web/src/lib/llm/utils.ts
+++ b/web/src/lib/llm/utils.ts
@@ -1,11 +1,11 @@
 import { Persona } from "@/app/admin/assistants/interfaces";
 import { LLMProviderDescriptor } from "@/app/admin/configuration/llm/interfaces";
-import { LlmDescriptor } from "@/lib/hooks";
+import { LlmOverride } from "@/lib/hooks";

 export function getFinalLLM(
  llmProviders: LLMProviderDescriptor[],
  persona: Persona | null,
-  currentLlm: LlmDescriptor | null
+  llmOverride: LlmOverride | null
 ): [string, string] {
  const defaultProvider = llmProviders.find(
    (llmProvider) => llmProvider.is_default_provider
@@ -26,9 +26,9 @@ export function getFinalLLM(
    model = persona.llm_model_version_override || model;
  }

-  if (currentLlm) {
-    provider = currentLlm.provider || provider;
-    model = currentLlm.modelName || model;
+  if (llmOverride) {
+    provider = llmOverride.provider || provider;
+    model = llmOverride.modelName || model;
  }

  return [provider, model];
@@ -37,7 +37,7 @@ export function getFinalLLM(
 export function getLLMProviderOverrideForPersona(
  liveAssistant: Persona,
  llmProviders: LLMProviderDescriptor[]
-): LlmDescriptor | null {
+): LlmOverride | null {
  const overrideProvider = liveAssistant.llm_model_provider_override;
  const overrideModel = liveAssistant.llm_model_version_override;

@@ -135,7 +135,7 @@ export const structureValue = (
  return `${name}__${provider}__${modelName}`;
 };

-export const destructureValue = (value: string): LlmDescriptor => {
+export const destructureValue = (value: string): LlmOverride => {
  const [displayName, provider, modelName] = value.split("__");
  return {
    name: displayName,
--- a/web/src/lib/users/UserSettings.tsx
+++ b/web/src/lib/users/UserSettings.tsx
@@ -1,3 +1,5 @@
+import { LlmOverride } from "../hooks";
+
 export async function setUserDefaultModel(
  model: string | null
 ): Promise<Response> {
Author	SHA1	Message	Date
pablonyx	6fb85d53c9	quick nit	2025-02-19 11:28:13 -08:00
pablonyx	3b92cf2f38	rate limit github fix	2025-02-19 11:28:13 -08:00
pablonyx	65485e0ea1	k	2025-02-19 11:28:13 -08:00
pablonyx	67028782f0	k	2025-02-19 11:28:13 -08:00
pablonyx	09b14c68ca	full gmail fix	2025-02-19 11:28:13 -08:00
pablonyx	8347bfe5ee	k	2025-02-19 11:28:13 -08:00
pablonyx	bf175d0749	k	2025-02-19 11:28:13 -08:00
pablonyx	c892dd9c6f	finalize	2025-02-19 11:28:13 -08:00
pablonyx	bf51ac5dc0	update	2025-02-19 11:28:13 -08:00